ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame で欠落している日付をゼロカウントで埋める方法は?

Pandas DataFrame で欠落している日付をゼロカウントで埋める方法は?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-12-05 18:03:15876ブラウズ

How to Fill Missing Dates in a Pandas DataFrame with Zero Counts?

不足している日付を Pandas データフレームに追加する

時系列データを操作する場合、特定の日付に対応するイベントがない状況が発生することがあります。このようなデータをプロットすると、異なる系列間で日付範囲が一致しない場合、不一致が生じる可能性があります。

この問題に対処する 1 つのアプローチは、欠落している日付をカウント 0 でデータフレームに追加することです。これにより、イベントのない日付であっても、期間全体を表す完全なグラフが保証されます。

これを実現するには、Series.reindex メソッドを利用します。この方法を使用すると、シリーズのインデックスを調整して、別のインデックスと一致させることができます。あなたの場合、目的の日付範囲に基づいてシリーズのインデックスを再作成し、その範囲内のすべての日付が含まれるようにします。欠落している日付にはゼロカウントが設定されます。

このアプローチを示す例を次に示します。

import pandas as pd

idx = pd.date_range('09-01-2013', '09-30-2013')

s = pd.Series({'09-02-2013': 2,
               '09-03-2013': 10,
               '09-06-2013': 5,
               '09-07-2013': 1})

s.index = pd.DatetimeIndex(s.index)

s = s.reindex(idx, fill_value=0)

print(s)

このコードは次の出力を生成します。

2013-09-01     0
2013-09-02     2
2013-09-03    10
2013-09-04     0
2013-09-05     0
2013-09-06     5
2013-09-07     1
...

ご覧のとおり、欠落している日付 (09-04 と 09-05) がカウント 0 で系列に追加され、その結果、完全なグラフが得られます。 30日。再インデックス方法を使用すると、日付範囲の不一致を効果的に処理し、時系列データの包括的な視覚化を作成できます。

以上がPandas DataFrame で欠落している日付をゼロカウントで埋める方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。