ホームページ >バックエンド開発 >Python チュートリアル >Pandas で重複する列を効率的に削除するにはどうすればよいですか?

Pandas で重複する列を効率的に削除するにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-11-04 20:38:01746ブラウズ

How to Efficiently Remove Duplicate Columns in Pandas?

Pandas での重複列の効率的な削除

データフレーム内のデータを操作する場合、多くの場合、データの整合性を確保するために重複列を削除する必要があります。そして効率性。 Pandas には、この問題に対する洗練された解決策があります。

重複する列名の削除

「Time」、「Time Relative」、「Time Relative」という名前の列を持つデータフレームがあるとします。そして「Time」の複数のインスタンス。重複する列名を削除するには、次のコードを使用します。

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>

このアプローチでは、重複する列名がチェックされ、一意の列名のみが保持されます。

値に基づいて重複を削除

場合によっては、値に基づいて重複した列を削除する必要がある場合があります。次のコードはまさにそれを行います:

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>

このコードはラムダ関数を各列に適用し、重複する値をチェックします。列内のすべての値が一意である場合、その列は保持されます。それ以外の場合は破棄されます。

注意事項

上記のアプローチでは値に基づいて重複列が効率的に削除されますが、特定の使用例を考慮することが重要です。意図した結果が得られない状況がある可能性があるため、この方法がデータおよび望ましい結果と一致していることを確認してください。

これらのアプローチを利用すると、データフレームから重複した列を簡単に削除でき、データの一貫性を確保できます。効率を向上させます。

以上がPandas で重複する列を効率的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。