Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengeluarkan Lajur Pendua dalam Python DataFrames?

Bagaimana untuk Mengeluarkan Lajur Pendua dalam Python DataFrames?

Mary-Kate Olsenasal: 2024-11-04 08:11:02819semak imbas

How to Remove Duplicate Columns in Python DataFrames?

Mengalih keluar Lajur Pendua dalam Bingkai Data Python

Apabila bekerja dengan bingkai data, lajur pendua selalunya boleh timbul, mewujudkan lebihan dan berpotensi menyebabkan kekeliruan. Ini boleh mengecewakan terutamanya jika anda ingin mengekalkan hanya lajur unik. Nasib baik, terdapat penyelesaian mudah untuk mengalih keluar lajur pendua dalam panda Python.

Penyelesaian untuk Mengalih Keluar Lajur mengikut Nama

Untuk mengalih keluar lajur pendua berdasarkan namanya, gunakan yang berikut baris:

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>

Pendekatan ini menggunakan operator ~ untuk menyongsangkan nilai boolean yang dikembalikan oleh df.columns.duplicated(), yang menyemak nama lajur pendua. Tatasusunan boolean yang terhasil kemudiannya digunakan untuk memilih hanya lajur tidak pendua dalam pengindeksan df.loc. Kaedah .copy() ditambah untuk mengelakkan kemungkinan ralat dalam mengubah suai bingkai data asal kemudian.

Penyelesaian untuk Mengalih Keluar Pendua mengikut Nilai

Andaikan anda ingin mengalih keluar lajur pendua dengan menyemak nilai mereka, bukan hanya nama mereka. Ini boleh dicapai menggunakan kod berikut:

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>

Penyelesaian ini mengelakkan pemindahan bingkai data, yang boleh memakan masa untuk bingkai data yang besar. Ia menggunakan fungsi lambda pada setiap lajur untuk menyemak nilai pendua. Tatasusunan boolean yang terhasil kemudiannya digunakan untuk memilih hanya lajur tanpa nilai pendua.

Nota: Berhati-hati apabila menggunakan pendekatan berasaskan nilai. Ia mungkin tidak selalu memberikan hasil yang diingini dalam kes tertentu.

Petua Tambahan

Untuk mengalih keluar baris pendua, gunakan teknik yang sama pada indeks menggunakan df. loc[~df.index.duplicated(),:].
Gunakan kaedah drop_duplicates() untuk mengalih keluar baris pendua berdasarkan lajur tertentu.

Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Lajur Pendua dalam Python DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python pandas Boolean Array if for select Lambda using operator copy function this column

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Apakah Pembelajaran Mesin?Artikel seterusnya：Apakah Pembelajaran Mesin?

Artikel berkaitan

Lihat lagi