首頁 >後端開發 >Python教學 >如何對 Pandas 中的數據進行分組和求和以計算客戶和水果類型的總購買量?

如何對 Pandas 中的數據進行分組和求和以計算客戶和水果類型的總購買量?

Barbara Streisand
Barbara Streisand原創
2024-12-25 14:55:15339瀏覽

How Can I Group and Sum Data in Pandas to Calculate Total Purchases by Customer and Fruit Type?

對Pandas 中的資料進行分組和求和

在資料分析中,通常需要以特定標準聚合資料以獲得有意義的見解。 Pandas 是一個強大的 Python 資料操作庫,它提供了 groupby() 方法來根據一列或多列對資料進行分組。此方法可以與聚合函數(例如 sum())結合使用,來計算每個群組的聚合值。

按組別計算值的總和

假設我們有一個包含個人水果消費資訊的資料框。每行代表一次水果購買,包括水果種類、購買日期、顧客姓名、購買水果數量。

計算每個人購買的水果總數,以水果種類和顧客姓名分組,我們可以使用以下步驟:

第1 步:將資料分組

首先,我們將DataFrame 依兩者分組使用groupby()方法的「Fruit」和「Name」欄位:

df_grouped = df.groupby(['Fruit', 'Name'])

這將建立一個 SeriesGroupBy 對象,它表示分組資料。

第2 步:應用Sum 函數

為了計算每組購買的水果總數,我們將sum() 函數應用於分組系列:

df_grouped_sum = df_grouped['Number'].sum()

產生的系列df_grouped_sum 包含水果類型和客戶名稱的每個獨特組合的水果購買總和。

範例

考慮以下因素DataFrame:

   Fruit   Date      Name  Number
Apples  10/6/2016 Bob    7
Apples  10/6/2016 Bob    8
Apples  10/6/2016 Mike   9
Apples  10/7/2016 Steve 10
Apples  10/7/2016 Bob    1
Oranges 10/7/2016 Bob    2
Oranges 10/6/2016 Tom   15
Oranges 10/6/2016 Mike  57
Oranges 10/6/2016 Bob   65
Oranges 10/7/2016 Tony   1
Grapes  10/7/2016 Bob    1
Grapes  10/7/2016 Tom   87
Grapes  10/7/2016 Bob   22
Grapes  10/7/2016 Bob   12
Grapes  10/7/2016 Tony  15

對這個DataFrame 應用groupby() 和sum() 操作,我們得到以下結果:

                 Number
Fruit   Name         
Apples  Bob        16
        Mike        9
        Steve      10
Grapes  Bob        35
        Tom        87
        Tony       15
Oranges Bob        67
        Mike       57
        Tom        15
        Tony        1

此輸出顯示了購買的水果總數每個人,按水果類型細分。

以上是如何對 Pandas 中的數據進行分組和求和以計算客戶和水果類型的總購買量?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn