Maison >développement back-end >Tutoriel Python >Comment remplir les dates manquantes dans un DataFrame Pandas ?
Ajouter des dates manquantes au cadre de données Pandas
Lorsque vous traitez des données de séries chronologiques, il est courant de rencontrer des dates manquantes. Cela peut se produire lorsque des événements se produisent à certaines dates mais pas à d’autres. Pour représenter avec précision ces données, il est nécessaire de prendre en compte les dates manquantes.
Dans le code fourni, une trame de données Pandas est créée avec la date comme index. Bien que la plage de dates inclut tous les jours d'une période spécifique, la taille de la trame de données est plus petite car certaines dates n'ont aucun événement associé. Cela entraîne des tailles incompatibles lorsque vous tentez de tracer la plage de dates et le cadre de données.
L'approche préférée consiste à ajouter les dates manquantes à la série avec un nombre de 0. Cela garantit un graphique complet avec toutes les dates prises en compte. Pour ce faire, la méthode de réindexation peut être utilisée :
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
Cela affichera une nouvelle série s avec toutes les dates manquantes entre le « 01-09-2013 » et le « 30-09-2013 » remplies de 0. valeurs :
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
En utilisant la réindexation, les dates manquantes sont ajoutées à la série, permettant un traçage et une analyse précis des données de séries chronologiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!