Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengenalpasti Semua Baris Pendua dalam Pandas DataFrame?
Bagaimanakah Saya Mendapatkan Senarai Semua Item Pendua Menggunakan Panda dalam Python?
Masalah:
DataFrame Pandas anda mengandungi baris pendua, tetapi menggunakan kaedah pendua() hanya mengembalikan contoh pendua yang pertama. Anda inginkan senarai komprehensif semua kejadian baris pendua untuk perbandingan manual.
Penyelesaian 1: Asingkan Baris dengan ID Pendua
<code class="python">df[ids.isin(ids[ids.duplicated()])].sort_values("ID")</code>
Walaupun kaedah ini berkesan mendapatkan semula semua baris pendua, kaedah ini mencipta baris ID pendua dalam output.
Penyelesaian 2 : Kumpulan mengikut ID dan Tapis untuk Pendua
<code class="python">pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)</code>
Pendekatan ini menghasilkan output yang diperkemas tanpa baris ID yang berlebihan.
Atas ialah kandungan terperinci Bagaimana untuk Mengenalpasti Semua Baris Pendua dalam Pandas DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!