ホームページ >バックエンド開発 >Python チュートリアル >パンダの別の列の対応する値を使用して、ある列の欠損値を効率的に埋めるにはどうすればよいですか?

パンダの別の列の対応する値を使用して、ある列の欠損値を効率的に埋めるにはどうすればよいですか?

DDD
DDDオリジナル
2024-11-13 05:29:02196ブラウズ

How to efficiently fill missing values in one column using corresponding values from another column in pandas?

fillna() を効率的に利用して、欠損値を別の列の対応する値で埋める

表形式のデータを操作する場合、欠損値がよく発生し、分析を妨げる可能性があります。 pandas fillna() メソッドは、これらの null 値を目的の値に置き換えるための簡単で効率的なソリューションを提供します。ただし、fillna() を介して欠損セルに特定の値を直接割り当てることは、特に大規模なデータセットの場合、非効率的で時間がかかる可能性があります。

この制限を克服するために、pandas は欠損値を次で埋めることができる強力な機能を提供します。別の列の対応する要素。このアプローチにより、各行を手動で繰り返す必要がなくなり、パフォーマンスと保守性が大幅に向上します。

次の例で、「Cat2」列の値を使用して「Cat1」列の欠損値を埋める場合を考えてみましょう。

前:

Day Cat1 Cat2
1 cat mouse
2 dog elephant
3 cat giraf
4 NaN ant

後:

Day Cat1 Cat2
1 cat mouse
2 dog elephant
3 cat giraf
4 ant ant

fillna() メソッドを使用すると、このタスクを簡単に実行できます:

df['Cat1'].fillna(df['Cat2'])

このコードは、「Cat1」の欠落値を「Cat2」の対応する値で簡単に置き換え、データ構造を維持し、間違った値や矛盾した値が導入されるのを防ぎます。結果として得られる DataFrame には完全で一貫性のあるデータが含まれており、さらなる分析や処理にすぐに使用できます。

以上がパンダの別の列の対応する値を使用して、ある列の欠損値を効率的に埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。