ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?

Pandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-12-04 15:10:12515ブラウズ

How Can I Fill Missing Dates in My Pandas DataFrame?

Pandas DataFrames で欠落している日付を埋める

pandas データフレームを操作する場合、データセットから日付が欠落している状況がよく発生します。これにより、統計のプロットや計算などの操作を実行するときにエラーが発生する可能性があります。

データフレームに特定の日付に複数のイベントが含まれる場合、または特定の日付にイベントが存在しない場合を考えてみましょう。データフレームを日付でグループ化し、イベントをカウントすると、元の範囲よりも日付が少ない系列が得られる可能性があります。これにより、元の日付範囲に対して系列をプロットしようとするとエラーが発生する可能性があります。

この問題の解決策は、欠落している日付をカウント 0 で系列に追加することです。これは、再インデックスを使用して実現できます。関数。 reindex 関数は、新しいインデックスを引数として受け取り、欠落している値を指定された値 (デフォルトは NaN) で埋めます。

import pandas as pd

idx = pd.date_range('09-01-2013', '09-30-2013')

s = pd.Series({'09-02-2013': 2,
               '09-03-2013': 10,
               '09-06-2013': 5,
               '09-07-2013': 1})
s.index = pd.DatetimeIndex(s.index)

s = s.reindex(idx, fill_value=0)

上記のコードは、reindex を使用して欠落している日付をシリーズに追加します。塗りつぶし値は 0 です。これにより、「09-01-2013」から「09-30-2013」の範囲内のすべての日付を含むシリーズが作成され、カウントはイベントが発生しなかった日付は 0。

以上がPandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。