ホームページ >バックエンド開発 >Python チュートリアル >正確にプロットするために Pandas DataFrame で欠落している日付を処理するにはどうすればよいですか?
Pandas DataFrames で欠落している日付に対処する
Pandas DataFrame でデータを分析する場合、データにギャップや欠落があるシナリオに遭遇するのが一般的です。データセット。これにより、データのプロットや操作が困難になる可能性があります。
たとえば、ある日付には複数のイベントがあり、他の日付にはイベントが存在しないデータフレームを考えてみましょう。 idx 変数 (日付の範囲) のサイズは一定のままですが、s シリーズ (日付ごとのイベント数を表す) には idx の日付のサブセットのみが含まれる場合があります。その結果、2 つのデータセットのサイズが一致しないため、これらの系列をプロットしようとするとエラーが発生する可能性があります。
この問題を解決する 1 つのアプローチは、欠落している日付を s シリーズに追加することです。 count of 0。これにより、イベントのない日付の値が 0 である完全なグラフが可能になります。これを実現するには、Pandas シリーズの reindex メソッドを使用できます。
reindex メソッドを使用すると、欠損値のあるインデックスを指定し、それらの値を指定した値で埋めることができます。この場合、idx シリーズを新しいインデックスとして指定し、欠落している日付にフィル値 0 を割り当てることができます。
例を次に示します。
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = df.groupby(['simpleDate']).size() s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
このコードはシリーズを作成します。 s には idx 範囲内のすべての日付が含まれ、もともと s に存在しなかった日付の値は 0 になります。次に、この系列を idx の日付に対してプロットして、欠落した日付がゼロ値で表された完全なグラフを取得できます。
以上が正確にプロットするために Pandas DataFrame で欠落している日付を処理するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。