如何删除 Pandas 中的重复列
如果您正在处理具有重复列的 DataFrame,您可能需要删除它们出于数据一致性或分析目的。这里有一个简单的解决方案来实现这一点:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
机制:
注意:此方法根据列名称而不是列值检查重复项。
替代方法:
删除重复项索引:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
这使用与上面类似的机制删除任何重复的行,但它检查索引而不是列名称。
按值删除重复项(警告):
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
此方法会扫描每一列,如果该列中的所有值都重复,则将其删除。但是,应谨慎使用它,因为它检查值而不是列名称,并且可能无法在所有情况下产生所需的结果。
以上是如何删除 Pandas 中的重复列?的详细内容。更多信息请关注PHP中文网其他相关文章!