Pandas의 Groupby Groupby 및 Average
문제:
'cluster가 포함된 DataFrame 제공 ', 'org' 및 'time' 열에서 '클러스터'별 'org'별 평균 '시간'을 어떻게 계산한 다음 각 '클러스터' 그룹의 '시간' 평균을 구할 수 있습니까?
예상:
cluster | mean(time) |
---|---|
1 | 15 |
2 | 54 |
3 | 6 |
해결책:
원하는 결과를 얻으려면 다음 단계를 사용할 수 있습니다.
Groupby ['cluster', 'org'] 및 Take Mean:
mean_by_cluster_org = df.groupby(['cluster', 'org'], as_index=False).mean()
Groupby ['cluster' ] 및 평균 계산:
cluster_average = mean_by_cluster_org.groupby('cluster')['time'].mean()
결과 표시:
print(cluster_average)
또는 다음 방법을 사용하여 이 문제를 해결할 수도 있습니다.
옵션 1: Groupby Only ['cluster'] 및 Take Mean:
cluster_only_average = df.groupby('cluster').mean()
옵션 2: Groupby ['cluster', 'org'] 및 평균 사용:
cluster_org_mean = df.groupby(['cluster', 'org']).mean()
선택한 접근 방식에 관계없이 출력은 'org'당 평균 '시간'을 제공합니다. 각 '클러스터' 그룹에 대해 그리고 '클러스터'당 '시간'의 전체 평균입니다.
위 내용은 Pandas에서 '클러스터'별 '조직'별 평균 '시간'을 계산한 다음 각 '클러스터' 그룹의 평균 '시간'을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!