首頁  >  文章  >  後端開發  >  如何刪除 Pandas 中重複的索引行?

如何刪除 Pandas 中重複的索引行?

Barbara Streisand
Barbara Streisand原創
2024-11-22 05:51:16410瀏覽

How to Remove Duplicate Indexed Rows in Pandas?

刪除Pandas 中重複的索引行

在pandas 中,重複的索引值可能在各種情況下出現,例如從多個來源追加資料時或修正錯誤的觀察結果。刪除這些重複行對於資料一致性和分析準確性至關重要。

一個建議的方法是利用 ~df3.index.duplicate(keep='first') 方法。此方法有效地識別並刪除重複行,同時保留資料幀中的唯一行:

df3 = df3[~df3.index.duplicated(keep='first')]

此方法在效能方面優於其他技術,例如 drop_duplicates 和 groupby,特別是對於大型資料幀。此外,它更具可讀性和易於理解。

對於MultiIndex 資料幀,可以使用~df1.index.duplicate(keep='last') 方法,該方法保留每個唯一索引值的最後一次出現:

df1[~df1.index.duplicated(keep='last')]

使用此方法可確保產生的資料幀僅包含唯一的索引值,消除可能幹擾資料分析和的冗餘行建模。

以上是如何刪除 Pandas 中重複的索引行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn