Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana Mengira Nilai Unik Dalam Kumpulan Menggunakan nunique() dalam Panda?

Bagaimana Mengira Nilai Unik Dalam Kumpulan Menggunakan nunique() dalam Panda?

Susan Sarandon
Susan Sarandonasal
2024-10-18 15:44:03461semak imbas

How to Count Unique Values Within Groups Using nunique() in Pandas?

Mengira Nilai Unik setiap Kumpulan dalam Panda dengan nunique

Dalam panda, mengira nilai unik dalam kumpulan boleh dilakukan menggunakan kaedah nunique() . Ini amat berguna apabila bekerja dengan data di mana anda perlu menentukan bilangan nilai yang berbeza dalam kategori atau kumpulan tertentu.

Masalah:

Pertimbangkan DataFrame dengan perkara berikut data:

ID domain
123 vk.com
123 vk.com
123 twitter.com
456 vk.com
456 facebook.com
456 vk.com
456 google.com
789 twitter.com
789 vk.com

Tugasnya ialah mengira ID unik untuk setiap domain dalam DataFrame ini.

Penyelesaian:

Untuk mengira nilai unik setiap kumpulan, gunakan kaedah nunique() dengan lajur kumpulan yang dikehendaki. Dalam kes ini, lajur domain mewakili kumpulan:

<code class="python">df = df.groupby('domain')['ID'].nunique()
print(df)</code>

Output:

domain count
facebook.com 1
google.com 1
twitter.com 2
vk.com 3

Pertimbangan Tambahan:

  • Untuk mengalih keluar sebarang petikan tunggal (') daripada nilai domain, gunakan kaedah str.strip("'") sebelum mengumpulkan.
  • Untuk mengekalkan nama lajur, gunakan argumen as_index=False dalam groupby() dan hantar kaedah nunique() kepada fungsi agg().

Atas ialah kandungan terperinci Bagaimana Mengira Nilai Unik Dalam Kumpulan Menggunakan nunique() dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn