ホームページ  >  記事  >  バックエンド開発  >  Pandas DataFrame の欠損値を効率的に埋めるにはどうすればよいですか?

Pandas DataFrame の欠損値を効率的に埋めるにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-11-11 10:30:03671ブラウズ

How to Efficiently Fill Missing Values in Pandas DataFrames?

DataFrames で欠損値を埋める: 効率的なアプローチ

パンダで不完全なデータセットを操作する場合、多くの場合、欠損値を埋めることが必要になります。各行を反復処理するのは非効率的ですが、fillna は列全体の欠損値を埋めるための便利なソリューションを提供します。

「Cat1」列に欠損値がある次の DataFrame を考えてみましょう:

        Day  Cat1  Cat2
0         1    cat   mouse
1         2    dog   elephant
2         3    cat   giraf
3         4    NaN   ant

To 「Cat2」の値を使用して 4 行目の「Cat1」の欠損値を埋めるには、次のように fillna メソッドを利用できます。

df['Cat1'].fillna(df['Cat2'])

このアプローチは、欠損を埋めるための迅速でメモリ効率の高いソリューションを提供します。大規模なデータセット内の値。 fillna メソッドは別の列を引数として受け取り、一致するインデックスを使用して欠損値を置き換えます。

結果:

        Day  Cat1  Cat2
0         1    cat   mouse
1         2    dog   elephant
2         3    cat   giraf
3         4    ant   ant

この効率的なメソッドを利用してパンダの欠損値を埋めることで、開発者は次のことが可能になります。データの整合性を確保し、データ分析の精度を高めます。

以上がPandas DataFrame の欠損値を効率的に埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。