Pandas 數據分組計數和最大計數檢索
問題:
給定一個Pandas DataFrame對於多列,如何按兩個特定列有效地將行分組並獲取每組中的計數?此外,如何確定分組列之一中每個值的最大計數?
解:
以兩列將DataFrame 行分組並計算出現次數,使用groupby() 函數,然後使用size() 方法:
<code class="python">df.groupby(['col5', 'col2']).size()</code>
此操作會根據指定的欄位建立群組,並傳回每個群組中的行數。輸出將類似於以下內容:
col5 col2 count 1 A 1 D 3 2 B 2 ...
要查找col2 列中每個值的最大計數:
<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
此操作按col2 列層級將計數資料分組,並且傳回每個col2 值的最大計數,產生如下輸出:
col2 A 3 B 2 C 1 D 3
附加說明:
按多列分組並獲取計數和附加摘要統計信息,您可以將groupby() 與agg() 等其他方法結合使用,它允許您指定多個聚合函數:
<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
以上是如何將 Pandas 資料分組、計算出現次數並找出最大計數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!