Rumah >pembangunan bahagian belakang >Tutorial Python >Apakah Perbezaan Antara `groupby().count()` dan `groupby().size()` dalam Panda?

Apakah Perbezaan Antara `groupby().count()` dan `groupby().size()` dalam Panda?

Linda Hamilton
Linda Hamiltonasal
2024-11-28 17:38:11720semak imbas

What's the Difference Between `groupby().count()` and `groupby().size()` in Pandas?

Memahami Perbezaan antara Saiz dan Kiraan dalam Panda

Panda, perpustakaan Python yang berkuasa untuk manipulasi dan analisis data, menawarkan operasi yang fleksibel seperti mengumpulkan data mengikut kategori. Apabila bekerja dengan data terkumpul, memahami perbezaan antara kaedah kiraan dan saiz adalah penting.

Soalan: Apa yang memisahkan kumpulan mengikut("x").kira dan kumpulan mengikut("x").saiz dalam Pandas ? Adakah saiz hanya mengecualikan null?

Jawapan:

Perbezaan antara kiraan dan saiz terletak pada pengendalian nilai NaN mereka:

  • saiz: Termasuk nilai NaN, pada asasnya memberikan jumlah bilangan pemerhatian dalam setiap kumpulan.
  • kira: Tidak termasuk nilai NaN, menghasilkan bilangan pemerhatian bukan nol untuk setiap kumpulan.

Contoh:

Pertimbangkan Panda berikut DataFrame:

df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})

Menilai kaedah kiraan dan saiz pada lajur 'b' dikumpulkan mengikut 'a':

print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())

Output:

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64

Seperti yang terbukti, kaedah kiraan mengecualikan nilai NaN dalam kumpulan 4 (dengan 'a' ialah 2), manakala kaedah saiz merangkuminya.

Atas ialah kandungan terperinci Apakah Perbezaan Antara `groupby().count()` dan `groupby().size()` dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn