首頁 >後端開發 >Python教學 >如何刪除 Pandas 資料框中的重複列?

如何刪除 Pandas 資料框中的重複列?

DDD
DDD原創
2024-11-01 14:08:02307瀏覽

How to Remove Duplicate Columns in a Pandas Dataframe?

刪除Pandas 資料框中的重複欄位

處理包含重複列的資料框時,有必要消除這些冗餘以獲得有效數據分析。本文提供了刪除 Pandas 中重複列的全面解決方案,解決了這個問題的各個方面。

重複的列名稱

要只根據重複名稱刪除列,一個簡單的解決方案是:

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>

此行檢查重複的列名稱,並僅保留唯一的列名稱。

重複的列值

如果目標是基於重複值刪除列,則需要不同的方法而不轉置資料框:

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>

此方法檢查每個欄位中的重複值並消除所有值都是重複的欄位。

重複索引

要刪除重複索引,請遵循類似的方法:

<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>

附加說明

  • 附加說明
  • 附加說明
附加說明附加說明附加說明>提供的解決方案假設資料幀已載入到名為df 的變數中。 ~df.columns.duplicated() 和 ~df.index.duplicated() 傳回布林數組,指示哪些欄位或索引重複。 ~df.apply(lambda x: x.duplicated(),axis=1).all() 中的 all() 函數檢查列中的所有值是否重複。 .copy() 方法用於建立經過修改的新資料框,避免修改現有資料框時出現任何問題。

以上是如何刪除 Pandas 資料框中的重複列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn