ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame の NaN 値を効果的に置き換えるにはどうすればよいですか?

Pandas DataFrame の NaN 値を効果的に置き換えるにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-12-03 20:16:10269ブラウズ

How can I effectively replace NaN values in Pandas DataFrames?

Dataframe 列の NaN 値の置換

Pandas で DataFrame を操作する場合、欠落しているデータまたは無効なデータが NaN 値で表されることがあります。データの品質を確保し、エラーを防ぐために、多くの場合、これらの NaN 値を適切なプレースホルダーまたは代入に置き換える必要があります。

DataFrame.fillna() メソッド

最も簡単なメソッドNaN 値を置き換えるメソッドは、fillna() メソッドを使用します。値またはディクショナリを引数として受け取り、指定された列またはデータフレーム全体のすべての NaN 値を指定された値で置き換えます。

例:

import pandas as pd

df = pd.DataFrame({
    "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489],
    "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", 
             "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"],
    "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")]
})

df.fillna(0)

出力:

       itm       Date    Amount
0     420  2012-09-30    65211
1     421  2012-09-09    29424
2     421  2012-09-16    29877
3     421  2012-09-23    30990
4     421  2012-09-30    61303
5     485  2012-09-09    71781
6     485  2012-09-16      0.0
7     485  2012-09-23   11072.0
8     485  2012-09-30  113702.0
9     489  2012-09-09    64731
10    489  2012-09-16      0.0

追加メソッド:

fillna() が最も一般的ですが、NaN 値を置換するために使用できるメソッドが他にもいくつかあります:

  • .replace() : このメソッドは、NaN 値を特定の値またはマスク.
  • .interpolate(): このメソッドは、さまざまな補間手法を使用して欠損値を推定します。
  • .pivot_table(): これこのメソッドを使用すると、欠落を無視してデータをグループ化および集計できます。

結論:

DataFrame 内の NaN 値の置換は、データのクリーニングと操作に不可欠です。上記の方法を利用することで、欠落しているデータや無効なデータを効果的に処理し、データ分析の整合性と品質を確保できます。

以上がPandas DataFrame の NaN 値を効果的に置き換えるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。