Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?

Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?

Barbara Streisand
Barbara Streisandasal
2024-12-25 19:27:14889semak imbas

How to Efficiently Count Term Occurrences by ID and Group in Pandas?

Mengambil Kiraan Tempoh mengikut ID dan Kumpulan dengan Kumpulan Pandas

Masalah

Diberikan DataFrame yang mengandungi lajur untuk ID (id), kumpulan (kumpulan ), dan istilah (istilah), matlamatnya adalah untuk mengira kejadian setiap istilah dengan cekap untuk setiap gabungan unik ID dan kumpulan.

Penyelesaian

Menggunakan fungsi kumpulan mengikut saiz dan saiz Pandas, kita boleh mencapainya tanpa perlu menggunakan gelung:

df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)

Hasil

Ini operasi menghasilkan MultiIndex DataFrame hierarki yang membentangkan istilah kiraan:

         term

kumpulan penggal1 penggal2 penggal3
id
1 3 2 0
2 2 1 1

Prestasi Analisis

Walaupun untuk set data besar dengan berjuta-juta baris, pendekatan vektor ini menunjukkan prestasi yang luar biasa:

1,000,000 rows
----------------
Elapsed time: 1.2 seconds

Atas ialah kandungan terperinci Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn