ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?

Pandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-12-18 22:27:10600ブラウズ

How to Fill Missing Dates in a Pandas DataFrame?

欠落している日付を Pandas Dataframe に追加する

時系列データを扱うとき、欠落している日付が発生することがよくあります。これは、イベントが特定の日付には発生するが、他の日付には発生しない場合に発生する可能性があります。このデータを正確に表現するには、欠落している日付を考慮する必要があります。

提供されたコードでは、日付をインデックスとして Pandas データフレームが作成されます。日付範囲には特定の時間枠内のすべての日が含まれますが、一部の日付には関連するイベントがないため、データフレームのサイズは小さくなります。これにより、日付範囲とデータフレームをプロットしようとすると、サイズが不一致になります。

推奨されるアプローチは、欠落している日付をカウント 0 で系列に追加することです。これにより、すべての日付が考慮された完全なグラフが保証されます。これを行うには、再インデックス メソッドを利用できます。

import pandas as pd

idx = pd.date_range('09-01-2013', '09-30-2013')

s = pd.Series({'09-02-2013': 2,
               '09-03-2013': 10,
               '09-06-2013': 5,
               '09-07-2013': 1})

s.index = pd.DatetimeIndex(s.index)

s = s.reindex(idx, fill_value=0)

これにより、「09-01-2013」と「09-30-2013」の間の欠落している日付がすべて 0 で埋められた新しいシリーズが出力されます。値:

2013-09-01     0
2013-09-02     2
2013-09-03    10
2013-09-04     0
2013-09-05     0
2013-09-06     5
2013-09-07     1
2013-09-08     0
...

再インデックスを使用すると、欠落している日付が系列に追加され、正確なプロットと分析が可能になります。時系列データ

以上がPandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。