對Pandas 中的資料進行分組和求和
在資料分析中,通常需要以特定標準聚合資料以獲得有意義的見解。 Pandas 是一個強大的 Python 資料操作庫,它提供了 groupby() 方法來根據一列或多列對資料進行分組。此方法可以與聚合函數(例如 sum())結合使用,來計算每個群組的聚合值。
按組別計算值的總和
假設我們有一個包含個人水果消費資訊的資料框。每行代表一次水果購買,包括水果種類、購買日期、顧客姓名、購買水果數量。
計算每個人購買的水果總數,以水果種類和顧客姓名分組,我們可以使用以下步驟:
第1 步:將資料分組
首先,我們將DataFrame 依兩者分組使用groupby()方法的「Fruit」和「Name」欄位:
df_grouped = df.groupby(['Fruit', 'Name'])
這將建立一個 SeriesGroupBy 對象,它表示分組資料。
第2 步:應用Sum 函數
為了計算每組購買的水果總數,我們將sum() 函數應用於分組系列:
df_grouped_sum = df_grouped['Number'].sum()
產生的系列df_grouped_sum 包含水果類型和客戶名稱的每個獨特組合的水果購買總和。
範例
考慮以下因素DataFrame:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
對這個DataFrame 應用groupby() 和sum() 操作,我們得到以下結果:
Number Fruit Name Apples Bob 16 Mike 9 Steve 10 Grapes Bob 35 Tom 87 Tony 15 Oranges Bob 67 Mike 57 Tom 15 Tony 1
此輸出顯示了購買的水果總數每個人,按水果類型細分。
以上是如何對 Pandas 中的數據進行分組和求和以計算客戶和水果類型的總購買量?的詳細內容。更多資訊請關注PHP中文網其他相關文章!