Pandas의 동일한 열에 여러 집계 적용
Pandas에서 GroupBy.agg()는 여러 기능을 수행하는 편리한 방법을 제공합니다. 그룹화된 데이터. 그러나 agg()를 사용하여 동일한 열에 다른 함수를 적용하는 것은 어려울 수 있습니다.
전통적으로 구문은 올바르지 않지만 원하는 접근 방식은 중복 키를 agg()의 사전 인수에 전달하는 것입니다. Python에서는 허용됩니다.
이 문제를 해결하기 위해 pandas는 여러 옵션을 제공합니다.
옵션 1: 목록 튜플
2022-06-20 현재 선호되는 방법은 튜플[(열, 함수)] 목록을 agg()에 제공하는 것입니다. 여기서 각 튜플은 수행할 집계를 나타냅니다. 지정된 열.
df.groupby('dummy').agg( Mean=('returns', np.mean), Sum=('returns', np.sum))
옵션 2: 중첩 사전
또 다른 접근 방식은 외부 키가 열이고 내부 값이 적용되는 함수인 중첩 사전을 사용하는 것입니다.
df.groupby('dummy').agg({'returns': {'Mean': np.mean, 'Sum': np.sum}})
옵션 3: 함수 목록
Pandas의 과거 버전의 경우 대체 옵션은 함수를 목록으로 전달하는 것입니다. agg()의 사전 인수.
df.groupby('dummy').agg({'returns': [np.mean, np.sum]})
이러한 옵션을 활용하면 보조 함수를 사용하거나 명시적으로 agg()를 여러 번 호출할 필요 없이 동일한 열에서 여러 집계를 편리하게 수행할 수 있습니다.
위 내용은 Pandas의 동일한 열에 여러 집계를 어떻게 적용할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!