如何刪除Pandas 中的重複列
如果您正在處理具有重複列的DataFrame,您可能需要刪除它們出於資料一致性或分析目的。這裡有一個簡單的解決方案來實現這一點:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
機制:
注意:此方法根據列名稱而不是列值檢查重複項。
替代方法:
刪除重複項索引:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
這使用與上面類似的機制刪除任何重複的行,但它檢查索引而不是列名稱。
以值刪除重複項(警告):
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
此方法會掃描每一列,如果該列中的所有值都重複,則將其刪除。但是,應謹慎使用它,因為它檢查值而不是列名稱,並且可能無法在所有情況下產生所需的結果。
以上是如何刪除 Pandas 中的重複列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!