>백엔드 개발 >파이썬 튜토리얼 >Pandas GroupBy.agg()를 사용하여 단일 열에서 다중 집계를 수행하는 방법은 무엇입니까?

Pandas GroupBy.agg()를 사용하여 단일 열에서 다중 집계를 수행하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-10 17:31:10580검색

How to Perform Multiple Aggregations on a Single Column Using Pandas GroupBy.agg()?

Pandas GroupBy.agg()를 사용하여 동일한 열에 여러 집계

Pandas로 작업할 때 여러 집계를 수행해야 하는 경우가 많습니다. 같은 열. agg() 메서드에서 동일한 열을 여러 번 지정하는 간단한 접근 방식은 직관적이지만 구문상 올바르지 않습니다. 이는 GroupBy.agg()를 사용하여 단일 열에 다양한 집계 함수를 효과적이고 간결하게 적용하는 방법에 대한 의문을 제기합니다.

해결책

2022-06 기준- 20, 다중 집계에 권장되는 방법은 사전을 사용하는 것입니다. 구문:

df.groupby('dummy').agg({
    'returns': {'Mean': np.mean, 'Sum': np.sum}
})

이 예에서 'returns' 열은 평균 및 합계 함수를 모두 사용하여 집계됩니다. 결과 DataFrame에는 해당 집계를 표시하는 두 개의 새로운 열 '평균'과 '합계'가 포함됩니다.

역사 참고

사전 채택 전 구문에는 여러 가지 대체 방법이 두 가지가 있었습니다. aggregations:

  1. 함수를 목록으로 전달:
df.groupby('dummy').agg({'returns': [np.mean, np.sum]})

이 접근 방식은 함수를 목록으로 agg()에 직접 전달합니다. DataFrame에는 각각 평균 ​​및 합계 집계 결과가 포함된 두 개의 새로운 열이 포함됩니다.

  1. 함수를 중첩 사전으로 전달:
df.groupby('dummy').agg({'returns': {'f1': np.mean, 'f2': np.sum}})

목록 접근 방식과 유사하게 함수는 사전 내의 사전으로 전달됩니다. 내부 사전의 키는 함수 이름을 지정하고 값은 집계 함수를 지정합니다. DataFrame에는 지정된 각 함수 이름에 대한 열이 있습니다.

위 내용은 Pandas GroupBy.agg()를 사용하여 단일 열에서 다중 집계를 수행하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.