首頁 >後端開發 >Python教學 >如何刪除 Pandas 中重複的索引行？

如何刪除 Pandas 中重複的索引行？

How to Remove Duplicate Indexed Rows in Pandas?

刪除Pandas 中重複的索引行

在pandas 中，重複的索引值可能在各種情況下出現，例如從多個來源追加資料時或修正錯誤的觀察結果。刪除這些重複行對於資料一致性和分析準確性至關重要。

一個建議的方法是利用 ~df3.index.duplicate(keep='first') 方法。此方法有效地識別並刪除重複行，同時保留資料幀中的唯一行：

df3 = df3[~df3.index.duplicated(keep='first')]

此方法在效能方面優於其他技術，例如 drop_duplicates 和 groupby，特別是對於大型資料幀。此外，它更具可讀性和易於理解。

對於MultiIndex 資料幀，可以使用~df1.index.duplicate(keep='last') 方法，該方法保留每個唯一索引值的最後一次出現:

df1[~df1.index.duplicated(keep='last')]

使用此方法可確保產生的資料幀僅包含唯一的索引值，消除可能幹擾資料分析和的冗餘行建模。

以上是如何刪除 Pandas 中重複的索引行？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

看更多