Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengeluarkan Lajur Pendua dalam Panda dengan Cekap?
Penyingkiran Lajur Pendua yang Cekap dalam Panda
Apabila bekerja dengan data dalam bingkai data, selalunya perlu mengalih keluar lajur pendua untuk memastikan integriti data dan kecekapan. Dalam Pandas, terdapat penyelesaian yang elegan untuk masalah ini.
Mengalih keluar Nama Lajur Pendua
Andaikan anda mempunyai bingkai data dengan lajur bernama 'Masa', 'Relatif Masa', dan berbilang contoh 'Masa'. Untuk mengalih keluar nama lajur pendua, gunakan kod berikut:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Pendekatan ini menyemak nama lajur pendua dan hanya mengekalkan nama yang unik.
Mengalih Keluar Pendua Berdasarkan Nilai
Dalam sesetengah kes, anda mungkin perlu mengalih keluar lajur pendua berdasarkan nilainya. Kod berikut melakukan perkara itu:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Kod ini menggunakan fungsi lambda pada setiap lajur, menyemak nilai pendua. Jika semua nilai dalam lajur adalah unik, lajur itu disimpan; jika tidak, ia akan dibuang.
Nota tentang Kaveat
Walaupun pendekatan di atas dengan cekap mengalih keluar lajur pendua berdasarkan nilai, adalah penting untuk mempertimbangkan kes penggunaan tertentu. Pastikan kaedah ini selaras dengan data anda dan hasil yang diingini, kerana mungkin terdapat situasi di mana ia mungkin tidak memberikan hasil yang diharapkan.
Dengan menggunakan pendekatan ini, anda boleh mengalih keluar lajur pendua daripada bingkai data anda dengan mudah, memastikan ketekalan data dan meningkatkan kecekapan.
Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Lajur Pendua dalam Panda dengan Cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!