Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana Mengekstrak Baris Berdasarkan Nilai Berbeza dalam Lajur Bingkai Data?

Bagaimana Mengekstrak Baris Berdasarkan Nilai Berbeza dalam Lajur Bingkai Data?

Mary-Kate Olsen
Mary-Kate Olsenasal
2024-11-04 10:41:30659semak imbas

How to Extract Rows Based on Distinct Values in a Dataframe Column?

Mencari Nilai Berbeza dalam Lajur Bingkai Data

Apabila bekerja dengan bingkai data, selalunya perlu untuk mendapatkan semula baris berdasarkan nilai yang berbeza dalam lajur tertentu. Ini membolehkan kami menghapuskan nilai pendua dan mendapatkan set titik data yang unik.

Pertimbangkan rangka data berikut:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

Andaikan kami ingin mengekstrak baris yang sepadan dengan nilai unik dalam lajur COL2. Untuk mencapai matlamat ini, kita boleh menggunakan fungsi drop_duplicates panda. Fungsi ini mengambil nama lajur sebagai argumen dan mengalih keluar baris pendua daripada bingkai data.

<code class="python">import pandas as pd

df = pd.DataFrame(...)  # assuming the given dataframe
df = df.drop_duplicates('COL2')</code>

Secara lalai, drop_duplicates mengekalkan kejadian pertama bagi setiap nilai unik. Sebagai alternatif, kita boleh menentukan keep='last' untuk mengekalkan kejadian terakhir atau keep=False untuk mengalih keluar semua baris pendua:

<code class="python"># Keep first occurrence
df = df.drop_duplicates('COL2', keep='first')

# Keep last occurrence
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicates
df = df.drop_duplicates('COL2', keep=False')</code>

Selepas melaksanakan mana-mana arahan di atas, dataframe df akan mengandungi hanya baris sepadan dengan nilai yang berbeza dalam lajur COL2:

    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

Atas ialah kandungan terperinci Bagaimana Mengekstrak Baris Berdasarkan Nilai Berbeza dalam Lajur Bingkai Data?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn