Pandas 中的Groupby 和Average
問題:
給定一個有一個🎜>問題:
給定一個帶一個' cluster' 的DataFrame '、'org' 和'time'列,如何計算平均值每個“集群”每個“組織”的“時間”,然後取每個“集群”組的“時間”平均值?
cluster | mean(time) |
---|---|
1 | 15 |
2 | 54 |
3 | 6 |
解:
mean_by_cluster_org = df.groupby(['cluster', 'org'], as_index=False).mean()按['cluster', 'org'] 分組並取平均:
cluster_average = mean_by_cluster_org.groupby('cluster')['time'].mean()Groupby ['cluster']並計算平均值:
print(cluster_average)顯示結果:
或者,您也可以使用以下方法可以解決這個問題問題:
cluster_only_average = df.groupby('cluster').mean()選項1:僅 Groupby ['cluster'] 並取平均值:
cluster_org_mean = df.groupby(['cluster', 'org']).mean()選項 2:Groupby ['cluster', ' org']並使用平均值:無論採用哪種方法您選擇後,輸出將為您提供每個“集群”組的每個“組織”的平均“時間”以及每個「集群」的總體平均「時間」。
以上是如何計算 Pandas 中每個「組織」每個「集群」的平均「時間」以及每個「集群」組的平均「時間」?的詳細內容。更多資訊請關注PHP中文網其他相關文章!