ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame の欠損値を効率的に埋めるにはどうすればよいですか?
パンダで不完全なデータセットを操作する場合、多くの場合、欠損値を埋めることが必要になります。各行を反復処理するのは非効率的ですが、fillna は列全体の欠損値を埋めるための便利なソリューションを提供します。
「Cat1」列に欠損値がある次の DataFrame を考えてみましょう:
Day Cat1 Cat2 0 1 cat mouse 1 2 dog elephant 2 3 cat giraf 3 4 NaN ant
To 「Cat2」の値を使用して 4 行目の「Cat1」の欠損値を埋めるには、次のように fillna メソッドを利用できます。
df['Cat1'].fillna(df['Cat2'])
このアプローチは、欠損を埋めるための迅速でメモリ効率の高いソリューションを提供します。大規模なデータセット内の値。 fillna メソッドは別の列を引数として受け取り、一致するインデックスを使用して欠損値を置き換えます。
結果:
Day Cat1 Cat2 0 1 cat mouse 1 2 dog elephant 2 3 cat giraf 3 4 ant ant
この効率的なメソッドを利用してパンダの欠損値を埋めることで、開発者は次のことが可能になります。データの整合性を確保し、データ分析の精度を高めます。
以上がPandas DataFrame の欠損値を効率的に埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。