ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?
pandas データフレームを操作する場合、データセットから日付が欠落している状況がよく発生します。これにより、統計のプロットや計算などの操作を実行するときにエラーが発生する可能性があります。
データフレームに特定の日付に複数のイベントが含まれる場合、または特定の日付にイベントが存在しない場合を考えてみましょう。データフレームを日付でグループ化し、イベントをカウントすると、元の範囲よりも日付が少ない系列が得られる可能性があります。これにより、元の日付範囲に対して系列をプロットしようとするとエラーが発生する可能性があります。
この問題の解決策は、欠落している日付をカウント 0 で系列に追加することです。これは、再インデックスを使用して実現できます。関数。 reindex 関数は、新しいインデックスを引数として受け取り、欠落している値を指定された値 (デフォルトは NaN) で埋めます。
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
上記のコードは、reindex を使用して欠落している日付をシリーズに追加します。塗りつぶし値は 0 です。これにより、「09-01-2013」から「09-30-2013」の範囲内のすべての日付を含むシリーズが作成され、カウントはイベントが発生しなかった日付は 0。
以上がPandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。