ホームページ >バックエンド開発 >Python チュートリアル >パンダの別の列の対応する値を使用して、ある列の欠損値を効率的に埋めるにはどうすればよいですか?
表形式のデータを操作する場合、欠損値がよく発生し、分析を妨げる可能性があります。 pandas fillna() メソッドは、これらの null 値を目的の値に置き換えるための簡単で効率的なソリューションを提供します。ただし、fillna() を介して欠損セルに特定の値を直接割り当てることは、特に大規模なデータセットの場合、非効率的で時間がかかる可能性があります。
この制限を克服するために、pandas は欠損値を次で埋めることができる強力な機能を提供します。別の列の対応する要素。このアプローチにより、各行を手動で繰り返す必要がなくなり、パフォーマンスと保守性が大幅に向上します。
次の例で、「Cat2」列の値を使用して「Cat1」列の欠損値を埋める場合を考えてみましょう。
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | NaN | ant |
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | ant | ant |
fillna() メソッドを使用すると、このタスクを簡単に実行できます:
df['Cat1'].fillna(df['Cat2'])
このコードは、「Cat1」の欠落値を「Cat2」の対応する値で簡単に置き換え、データ構造を維持し、間違った値や矛盾した値が導入されるのを防ぎます。結果として得られる DataFrame には完全で一貫性のあるデータが含まれており、さらなる分析や処理にすぐに使用できます。
以上がパンダの別の列の対応する値を使用して、ある列の欠損値を効率的に埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。