執行分組聚合和平均計算
考慮以下帶有叢集、組織和時間資料的DataFrame:
cluster org time 0 a 8 1 a 6 2 h 34 3 c 23 4 d 74 5 w 6
目標是計算每個集群中每個組織的平均時間。預期結果應類似於:
cluster mean(time) 1 15 #=((8 + 6) / 2 + 23) / 2 2 54 #=(74 + 34) / 2 3 6
使用雙重GroupBy 和平均值計算的解決方案:
要實現此目的,請利用Pandas 的groupby 函數的強大功能:
cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean() result = cluster_org_time.groupby('cluster')['time'].mean():使用mean ()計算每個集群的時間平均值。
集群組平均值的替代解決方案:
cluster_mean_time = df.groupby(['cluster']).mean()
對於集群組的平均值僅,只需按['cluster' ] 進行分組並使用mean()計算平均值。
使用org 和平均值計算進行GroupBy 的附加選項:
cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()或者,您可以按['cluster', 'org'] 分組並直接計算平均值:
以上是如何計算 Pandas DataFrame 中每個叢集中每個組織的平均時間?的詳細內容。更多資訊請關注PHP中文網其他相關文章!