Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?

Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?

Patricia Arquette
Patricia Arquetteasal
2024-12-19 21:26:111021semak imbas

How to Calculate Group-Wise Statistics in Pandas Using GroupBy?

Cara Mendapatkan Statistik Bijak Kumpulan untuk Bingkai Data Menggunakan Pandas GroupBy

Apabila bekerja dengan data, selalunya berguna untuk dapat meringkaskan dan menganalisis data berdasarkan spesifik kriteria pengelompokan. Pandas, perpustakaan Python yang berkuasa untuk manipulasi dan analisis data, menyediakan cara yang mudah untuk melakukan ini melalui fungsi GroupBy.

Jawapan Pantas

Untuk mendapatkan kiraan baris dalam setiap kumpulan, gunakan saiz .size () kaedah, yang mengembalikan Siri:

df.groupby(['col1','col2']).size()

Untuk menukar ini kepada borang DataFrame, menggunakan:

df.groupby(['col1', 'col2']).size().reset_index(name='counts')

Sebagai alternatif, untuk mengira kiraan baris dan statistik lain bagi setiap kumpulan, pendekatan berikut boleh digunakan:

df.groupby(['col1', 'col2'])[['col3', 'col4']].agg({
    'col3': ['mean', 'count'], 
    'col4': ['median', 'min', 'count']
})

Contoh Terperinci

Andaikan kita mempunyai kerangka data bernama df dengan lajur col1 hingga col4. Untuk menggambarkan, mari kita hitung kiraan baris setiap kumpulan:

df.groupby(['col1', 'col2']).size()

Output akan memaparkan bilangan baris dalam setiap gabungan unik nilai col1 dan col2.

Untuk menambah kiraan ini sebagai lajur ke DataFrame kami, kami boleh menggunakan .reset_index(name='counts') kaedah:

df.groupby(['col1', 'col2']).size().reset_index(name='counts')

Termasuk Keputusan untuk Statistik Tambahan

Jika kita ingin mengira berbilang statistik pada data terkumpul, kita boleh menggunakan kaedah agg(). Sebagai contoh, untuk mengira min dan kiraan untuk col3 dan median, minimum dan kiraan untuk col4, kami akan menggunakan:

df.groupby(['col1', 'col2']).agg({
    'col3': ['mean', 'count'], 
    'col4': ['median', 'min', 'count']
})

Ini akan mengembalikan DataFrame dengan statistik yang diminta untuk setiap gabungan unik col1 dan nilai col2.

Kesimpulan

Pandas GroupBy ialah alat yang berkuasa untuk menganalisis data berdasarkan kriteria tertentu. Dengan menggunakan kaedah dan pengagregatan yang sesuai, anda boleh mendapatkan statistik mengikut kumpulan dengan cekap untuk mendapatkan cerapan dan memahami data anda dengan lebih teliti.

Atas ialah kandungan terperinci Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn