Rumah > Artikel > pembangunan bahagian belakang > Bagaimana untuk Mengira Purata Masa setiap Organisasi Dalam Setiap Kluster dalam Bingkai Data Pandas?
Melaksanakan Pengagregatan Berkumpulan dan Pengiraan Purata
Pertimbangkan DataFrame berikut dengan data tentang kelompok, organisasi dan masa:
cluster org time 0 a 8 1 a 6 2 h 34 3 c 23 4 d 74 5 w 6
Objektifnya adalah untuk mengira purata masa bagi setiap organisasi dalam setiap kluster. Hasil yang dijangkakan sepatutnya menyerupai:
cluster mean(time) 1 15 #=((8 + 6) / 2 + 23) / 2 2 54 #=(74 + 34) / 2 3 6
Penyelesaian Menggunakan Pengiraan Kumpulan BergandaBy dan Min:
Untuk mencapai ini, gunakan kuasa fungsi kumpulan mengikut kumpulan Pandas:
cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean() result = cluster_org_time.groupby('cluster')['time'].mean()
Penyelesaian Alternatif untuk Kumpulan Berkelompok Purata:
Untuk purata kumpulan kluster sahaja, cukup kumpulkan mengikut ['kluster'] dan hitung min menggunakan min().
cluster_mean_time = df.groupby(['cluster']).mean()
Pilihan Tambahan untuk GroupBy dengan org dan Pengiraan Min:
Sebagai alternatif, anda boleh mengumpulkan mengikut ['cluster', 'org'] dan terus mengira min:
cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()
Atas ialah kandungan terperinci Bagaimana untuk Mengira Purata Masa setiap Organisasi Dalam Setiap Kluster dalam Bingkai Data Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!