Rumah > Artikel > pembangunan bahagian belakang > Bagaimana untuk Mendapatkan Nilai Baris Berbeza daripada DataFrame dalam Pandas?
Mendapatkan Nilai Baris Berbeza daripada DataFrame
Dalam situasi ini, kami berhasrat untuk mengekstrak baris daripada DataFrame berdasarkan nilai unik dalam sesuatu lajur, mari kita nyatakan ia sebagai COL2.
Untuk menyelesaikan tugasan ini, kami memperkenalkan fungsi drop_duplicates. Ia membolehkan kami menghapuskan baris pendua dengan menyatakan lajur yang kami mahu semak untuk nilai pendua.
Memelihara Kejadian Pertama:
Sebagai contoh, jika kita ingin menyimpan sahaja kejadian pertama bagi setiap nilai COL2 yang berbeza, kita boleh menggunakan:
<code class="python">df = df.drop_duplicates('COL2')</code>
Sebagai alternatif, kita boleh menulis:
<code class="python">df = df.drop_duplicates('COL2', keep='first')</code>
Ini mengekalkan baris pertama untuk setiap nilai unik dalam COL2.
Mengekalkan Kejadian Terakhir:
Sebaliknya kami ingin mengekalkan kejadian terakhir bagi nilai berbeza, kami mengubah suai parameter simpan kepada 'terakhir':
<code class="python">df = df.drop_duplicates('COL2', keep='last')</code>
Mengalih Keluar Semua Pendua:
Untuk mengalih keluar semua baris pendua, termasuk yang mempunyai nilai yang sama dalam COL2, kami tetapkan keep kepada False:
<code class="python">df = df.drop_duplicates('COL2', keep=False)</code>
Dengan mengikuti teknik ini, anda boleh menghapuskan baris pendua dengan cekap berdasarkan nilai yang berbeza dalam lajur yang ditentukan, memastikan DataFrame anda mengandungi data unik sahaja.
Atas ialah kandungan terperinci Bagaimana untuk Mendapatkan Nilai Baris Berbeza daripada DataFrame dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!