Pandas で重複する列を削除する方法
Pandas でデータ フレームを操作する場合、重複した列が発生して乱雑になり、潜在的なエラーが発生する可能性があります。 。この問題を解決するには、重複列を効果的に削除する方法を知ることが重要です。
列名のみに基づいて重複列を削除するには、次のコード スニペットを利用できます:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
このメソッドは、各列名の重複をチェックし、一意の列のみを保持します。
ただし、値に基づいて重複した列を削除することが目的の場合は、別のアプローチが必要です。効率的な方法の 1 つは、ラムダ関数を各列に適用して、重複した値が含まれているかどうかを判断することです。
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
この手法では、各列の値の重複がチェックされ、完全に重複した値を含む列があれば削除されます。
特定のケースでは望ましい結果が得られない可能性があるため、このアプローチはすべてのデータセットに適しているわけではないことに注意してください。したがって、このメソッドを実装する場合は注意が必要です。
以上がPandas で重複する列を削除する方法: 名前または値で?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。