Maison >développement back-end >Tutoriel Python >Comment remplir les dates manquantes dans un DataFrame Pandas avec zéro compte ?
Lorsque vous travaillez avec des données de séries chronologiques, vous pouvez rencontrer des situations dans lesquelles certaines dates n'ont pas d'événements correspondants. Le tracé de telles données peut entraîner des incohérences si les plages de dates ne correspondent pas entre les différentes séries.
Une approche pour résoudre ce problème consiste à ajouter les dates manquantes à la trame de données avec un décompte nul. Cela garantit un graphique complet représentant toute la période, même pour les dates sans événements.
Pour y parvenir, vous pouvez utiliser la méthode Series.reindex. Cette méthode vous permet d'ajuster l'index d'une série pour qu'il corresponde à un index différent. Dans votre cas, vous réindexerez votre série en fonction de la plage de dates souhaitée, en vous assurant qu'elle inclut toutes les dates comprises dans cette plage. Toutes les dates manquantes seront renseignées avec un décompte nul.
Voici un exemple illustrant cette approche :
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0) print(s)
Ce code produit le résultat suivant :
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 ...
Comme vous que nous pouvons voir, les dates manquantes (09-04 et 09-05) ont été ajoutées à la série avec des comptes nuls, ce qui donne un graphique complet de 30 jours. En utilisant la méthode de réindexation, vous pouvez gérer efficacement les écarts de plage de dates et créer des visualisations complètes pour vos données de séries chronologiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!