Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana Mengira Nilai Berbeza mengikut Kumpulan dalam Panda?

Bagaimana Mengira Nilai Berbeza mengikut Kumpulan dalam Panda?

Linda Hamilton
Linda Hamiltonasal
2024-10-23 13:23:01627semak imbas

How to Count Distinct Values by Group in Pandas?

Pandas Equivalent: Distinct Count by Group

Apabila menggunakan Pandas sebagai alternatif pangkalan data, selalunya perlu melakukan operasi yang kompleks seperti pengiraan berbeza mengikut kumpulan. Dalam kes ini, kami ingin mengira bilangan pelanggan yang berbeza setiap bulan.

Dalam SQL, ini boleh dicapai menggunakan fungsi agregat count(distinct). Walau bagaimanapun, Pandas menyediakan sintaks yang sedikit berbeza untuk operasi ini.

Untuk mengira pelanggan yang berbeza setiap tahun bulan dalam Pandas, kami boleh menggunakan kod berikut:

<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>

Fungsi groupby() membahagikan DataFrame kepada kumpulan berdasarkan lajur yang ditentukan (TAHUN dalam kes ini). Fungsi nunique() kemudian mengira bilangan nilai unik dalam setiap kumpulan.

Berikut ialah contoh untuk menggambarkan:

<code class="python">import pandas as pd

# Create a DataFrame with sample data
data = {
    'YEARMONTH': ['201301', '201301', '201301', '201302', '201302', '201302', '201302'],
    'CLIENTCODE': [1, 1, 2, 1, 2, 2, 3]
}
table = pd.DataFrame(data)

# Count distinct clients per year month
result = table.groupby('YEARMONTH').CLIENTCODE.nunique()

print(result)</code>

Output:

YEARMONTH
201301    2
201302    3

Sambil anda boleh lihat, hasilnya sepadan dengan output yang dijangkakan daripada pertanyaan SQL.

Atas ialah kandungan terperinci Bagaimana Mengira Nilai Berbeza mengikut Kumpulan dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn