首頁 >後端開發 >Python教學 >如何根據特定列刪除 Pandas 中的重複行?

如何根據特定列刪除 Pandas 中的重複行?

DDD
DDD原創
2024-12-17 13:03:26844瀏覽

How to Remove Duplicate Rows in Pandas Based on Specific Columns?

在Python Pandas 中刪除基於多列的重複行

Pandas 中的drop_duplicates 函數提供了一種從行的有效方法。但是,如果您只想刪除與一組特定列相符的行,該怎麼辦?

問題:

考慮一個包含「A」、「」列的DataFrame B」和「C」。您想要刪除「A」欄位和「C 」列中的值相同的行。換句話說,您需要識別並刪除此範例DataFrame 中的第0 行和第 1行:

A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A

解:

您現在可以使用以下方法輕鬆實現此目的drop_duplicates函數和subset參數:

A B C
0 foo 1 B
1 bar 1 A
keep=參數指定是否刪除重複行,包括第一次出現,或排除它們。將刪除所有重複項。

以上是如何根據特定列刪除 Pandas 中的重複行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn