Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk mengalih keluar Lajur Pendua dalam Bingkai Data Pandas?

Bagaimana untuk mengalih keluar Lajur Pendua dalam Bingkai Data Pandas?

DDD
DDDasal
2024-11-01 14:08:02303semak imbas

How to Remove Duplicate Columns in a Pandas Dataframe?

Alih Keluar Lajur Pendua dalam Bingkai Data Pandas

Apabila berurusan dengan bingkai data yang mengandungi lajur pendua, adalah perlu untuk menghapuskan redundansi ini untuk data yang berkesan analisis. Artikel ini menyediakan penyelesaian menyeluruh untuk mengalih keluar lajur pendua dalam Panda, menangani semua aspek isu.

Nama Lajur Pendua

Untuk mengalih keluar lajur berdasarkan nama pendua semata-mata, penyelesaian yang mudah ialah:

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>

Barisan ini menyemak nama lajur pendua dan hanya mengekalkan nama lajur yang unik.

Nilai Lajur Pendua

Jika matlamatnya adalah untuk mengalih keluar lajur berdasarkan nilai pendua, pendekatan berbeza diperlukan tanpa mengubah bingkai data:

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>

Kaedah ini menyemak nilai pendua dalam setiap lajur dan menghapuskan lajur yang semua nilai adalah pendua.

Indeks Pendua

Untuk mengalih keluar indeks pendua, ikut pendekatan yang serupa:

<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>

Nota Tambahan

  • Penyelesaian yang disediakan menganggap bingkai data telah dimuatkan ke dalam pembolehubah bernama df.
  • ~df.columns.duplicated() dan ~df.index.duplicated() mengembalikan tatasusunan boolean yang menunjukkan lajur atau indeks ialah pendua.
  • Fungsi all() dalam ~df.apply(lambda x: x.duplicated(),axis=1).all() menyemak sama ada semua nilai dalam lajur adalah pendua.
  • Kaedah .copy() digunakan untuk mencipta bingkai data baharu dengan pengubahsuaian, mengelakkan sebarang isu dengan mengubah suai bingkai data sedia ada.

Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar Lajur Pendua dalam Bingkai Data Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn