Pandas GroupBy.agg()를 사용하여 동일한 열에 여러 집계
Pandas로 작업할 때 여러 집계를 수행해야 하는 경우가 많습니다. 같은 열. agg() 메서드에서 동일한 열을 여러 번 지정하는 간단한 접근 방식은 직관적이지만 구문상 올바르지 않습니다. 이는 GroupBy.agg()를 사용하여 단일 열에 다양한 집계 함수를 효과적이고 간결하게 적용하는 방법에 대한 의문을 제기합니다.
해결책
2022-06 기준- 20, 다중 집계에 권장되는 방법은 사전을 사용하는 것입니다. 구문:
df.groupby('dummy').agg({ 'returns': {'Mean': np.mean, 'Sum': np.sum} })
이 예에서 'returns' 열은 평균 및 합계 함수를 모두 사용하여 집계됩니다. 결과 DataFrame에는 해당 집계를 표시하는 두 개의 새로운 열 '평균'과 '합계'가 포함됩니다.
역사 참고
사전 채택 전 구문에는 여러 가지 대체 방법이 두 가지가 있었습니다. aggregations:
df.groupby('dummy').agg({'returns': [np.mean, np.sum]})
이 접근 방식은 함수를 목록으로 agg()에 직접 전달합니다. DataFrame에는 각각 평균 및 합계 집계 결과가 포함된 두 개의 새로운 열이 포함됩니다.
df.groupby('dummy').agg({'returns': {'f1': np.mean, 'f2': np.sum}})
목록 접근 방식과 유사하게 함수는 사전 내의 사전으로 전달됩니다. 내부 사전의 키는 함수 이름을 지정하고 값은 집계 함수를 지정합니다. DataFrame에는 지정된 각 함수 이름에 대한 열이 있습니다.
위 내용은 Pandas GroupBy.agg()를 사용하여 단일 열에서 다중 집계를 수행하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!