Pandas で重複する列を削除する方法
重複した列を持つ DataFrame を扱っている場合は、それらを削除することをお勧めします。データの一貫性または分析の目的のため。これを実現する簡単な解決策は次のとおりです。
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
メカニズム:
注: このメソッドは、列の値ではなく列名に基づいて重複をチェックします。
代替アプローチ:
重複の削除インデックス:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
これは、上記と同様のメカニズムを使用して重複行を削除しますが、列名ではなくインデックスをチェックします。
値による重複の削除 (注意):
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
このアプローチでは、各列をスキャンし、その列のすべての値が重複している場合はその列を削除します。ただし、列名ではなく値をチェックし、すべてのケースで望ましい結果が得られるとは限らないため、使用には注意が必要です。
以上がPandas で重複する列を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。