Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah Saya Boleh Menghimpun dan Menjumlahkan Data dalam Panda untuk Mengira Jumlah Pembelian mengikut Pelanggan dan Jenis Buah?
Mengumpul dan Menjumlahkan Data dalam Panda
Dalam analisis data, selalunya perlu untuk mengagregatkan data mengikut kriteria khusus untuk memperoleh cerapan yang bermakna. Pandas, perpustakaan Python yang berkuasa untuk manipulasi data, menyediakan kaedah groupby() untuk mengumpulkan data berdasarkan satu atau lebih lajur. Kaedah ini boleh digabungkan dengan fungsi pengagregatan, seperti sum(), untuk mengira nilai agregat bagi setiap kumpulan.
Mengira Jumlah Nilai mengikut Kumpulan
Andaikan kita mempunyai DataFrame yang mengandungi maklumat tentang penggunaan buah-buahan oleh individu. Setiap baris mewakili pembelian buah, termasuk jenis buah, tarikh pembelian, nama pelanggan dan bilangan buah yang dibeli.
Untuk mengira jumlah bilangan buah yang dibeli oleh setiap individu, dikumpulkan mengikut jenis buah dan nama pelanggan , kita boleh menggunakan langkah berikut:
Langkah 1: Himpunkan Data
Mula-mula, kami kumpulkan DataFrame oleh kedua-dua lajur 'Fruit' dan 'Name' menggunakan kaedah groupby():
df_grouped = df.groupby(['Fruit', 'Name'])
Ini mencipta objek SeriesGroupBy, yang mewakili data terkumpul.
Langkah 2: Gunakan Fungsi Jumlah
Untuk mengira jumlah bilangan buah yang dibeli oleh setiap kumpulan, kami menggunakan fungsi sum() pada Siri berkumpulan:
df_grouped_sum = df_grouped['Number'].sum()
Siri yang terhasil, df_grouped_sum, mengandungi jumlah pembelian buah-buahan untuk setiap gabungan unik jenis buah dan nama pelanggan.
Contoh
Pertimbangkan perkara berikut DataFrame:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
Menggunakan operasi groupby() dan sum() pada DataFrame ini, kami mendapat hasil berikut:
Number Fruit Name Apples Bob 16 Mike 9 Steve 10 Grapes Bob 35 Tom 87 Tony 15 Oranges Bob 67 Mike 57 Tom 15 Tony 1
Output ini menunjukkan jumlah bilangan buah yang dibeli oleh setiap individu, dipecahkan mengikut jenis buah.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menghimpun dan Menjumlahkan Data dalam Panda untuk Mengira Jumlah Pembelian mengikut Pelanggan dan Jenis Buah?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!