ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame の NaN 値を効果的に置き換えるにはどうすればよいですか?
Dataframe 列の NaN 値の置換
Pandas で DataFrame を操作する場合、欠落しているデータまたは無効なデータが NaN 値で表されることがあります。データの品質を確保し、エラーを防ぐために、多くの場合、これらの NaN 値を適切なプレースホルダーまたは代入に置き換える必要があります。
DataFrame.fillna() メソッド
最も簡単なメソッドNaN 値を置き換えるメソッドは、fillna() メソッドを使用します。値またはディクショナリを引数として受け取り、指定された列またはデータフレーム全体のすべての NaN 値を指定された値で置き換えます。
例:
import pandas as pd df = pd.DataFrame({ "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489], "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"], "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")] }) df.fillna(0)
出力:
itm Date Amount 0 420 2012-09-30 65211 1 421 2012-09-09 29424 2 421 2012-09-16 29877 3 421 2012-09-23 30990 4 421 2012-09-30 61303 5 485 2012-09-09 71781 6 485 2012-09-16 0.0 7 485 2012-09-23 11072.0 8 485 2012-09-30 113702.0 9 489 2012-09-09 64731 10 489 2012-09-16 0.0
追加メソッド:
fillna() が最も一般的ですが、NaN 値を置換するために使用できるメソッドが他にもいくつかあります:
結論:
DataFrame 内の NaN 値の置換は、データのクリーニングと操作に不可欠です。上記の方法を利用することで、欠落しているデータや無効なデータを効果的に処理し、データ分析の整合性と品質を確保できます。
以上がPandas DataFrame の NaN 値を効果的に置き換えるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。