>  기사  >  백엔드 개발  >  Pandas 데이터를 그룹화하고, 발생 횟수를 계산하고, 최대 횟수를 찾는 방법은 무엇입니까?

Pandas 데이터를 그룹화하고, 발생 횟수를 계산하고, 최대 횟수를 찾는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-10-23 13:40:02626검색

How to Group Pandas Data, Count Occurrences, and Find Maximum Counts?

Pandas 데이터 그룹화 개수 및 최대 개수 검색

문제:

Pandas DataFrame 제공 여러 열을 사용하는 경우 두 개의 특정 열을 기준으로 행을 효율적으로 그룹화하고 각 그룹의 개수를 얻으려면 어떻게 해야 합니까? 또한 그룹화 열 중 하나에 있는 각 값의 최대 개수를 어떻게 결정합니까?

해결책:

DataFrame 행을 두 개의 열과 개수 발생으로 그룹화하려면 , groupby() 함수와 size() 메서드를 차례로 사용합니다.

<code class="python">df.groupby(['col5', 'col2']).size()</code>

이 작업은 지정된 열을 기반으로 그룹을 생성하고 각 그룹의 행 수를 반환합니다. 출력은 다음과 유사합니다.

col5  col2  count
1     A       1
      D       3
2     B       2
...

col2 열의 각 값에 대한 최대 개수를 찾으려면:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>

이 작업은 개수 데이터를 col2 열 수준별로 그룹화하고 각 col2 값의 최대 개수를 반환하여 다음과 같은 출력을 생성합니다.

col2
A       3
B       2
C       1
D       3

추가 참고 사항:

여러 열로 그룹화하고 개수 및 추가 요약 통계를 얻으려면 , 여러 집계 함수를 지정할 수 있는 agg()와 같은 다른 메서드와 함께 groupby()를 사용할 수 있습니다.

<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>

위 내용은 Pandas 데이터를 그룹화하고, 발생 횟수를 계산하고, 최대 횟수를 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.