首頁 >後端開發 >Python教學 >如何將 Pandas 資料分組、計算出現次數並找出最大計數?

如何將 Pandas 資料分組、計算出現次數並找出最大計數?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-10-23 13:40:02772瀏覽

How to Group Pandas Data, Count Occurrences, and Find Maximum Counts?

Pandas 數據分組計數和最大計數檢索

問題:

給定一個Pandas DataFrame對於多列,如何按兩個特定列有效地將行分組並獲取每組中的計數?此外,如何確定分組列之一中每個值的最大計數?

解:

以兩列將DataFrame 行分組並計算出現次數,使用groupby() 函數,然後使用size() 方法:

<code class="python">df.groupby(['col5', 'col2']).size()</code>

此操作會根據指定的欄位建立群組,並傳回每個群組中的行數。輸出將類似於以下內容:

col5  col2  count
1     A       1
      D       3
2     B       2
...

要查找col2 列中每個值的最大計數:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>

此操作按col2 列層級將計數資料分組,並且傳回每個col2 值的最大計數,產生如下輸出:

col2
A       3
B       2
C       1
D       3

附加說明:

按多列分組並獲取計數和附加摘要統計信息,您可以將groupby() 與agg() 等其他方法結合使用,它允許您指定多個聚合函數:

<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>

以上是如何將 Pandas 資料分組、計算出現次數並找出最大計數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn