>  기사  >  백엔드 개발  >  Pandas DataFrame을 여러 열로 그룹화하고 계산하고 최대 개수를 찾는 방법은 무엇입니까?

Pandas DataFrame을 여러 열로 그룹화하고 계산하고 최대 개수를 찾는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-10-23 12:13:02338검색
How to Group and Count Pandas DataFrames by Multiple Columns and Find Maximum Counts?그룹별 행 수 얻기:

각 행 내에서 발생 횟수를 계산하려면 col5 및 col2 값의 고유한 조합을 기반으로 다음과 같이 size() 메서드를 사용합니다.

이 작업은 DataFrame을 col5와 col2로 그룹화하고 각 그룹 내의 행 수를 계산합니다. 출력은 인덱스 쌍(col5, col2)과 해당 개수가 포함된 시리즈입니다.

예:

<code class="python">df.groupby(['col5', 'col2']).size()</code>

제공된 코드 조각은 df DataFrame을 사용하여 이 작업을 보여줍니다. 다음 출력이 생성됩니다.

이 출력에서 ​​각 행은 col5와 col2의 고유한 조합을 나타내며 해당 개수는 해당 조합이 DataFrame에서 발생하는 횟수를 나타냅니다.

각 col2 값에 대한 최대 개수 찾기:

col5  col2
1     A       1
      D       3
2     B       2
3     A       3
      C       1
4     B       1
5     B       2
6     B       1
dtype: int64

col2의 각 고유 값에 대한 최대 개수를 확인하려면 다음 단계를 수행합니다.

DataFrame을 다음과 같이 그룹화합니다. col2만, col5는 제외.

size()를 사용하여 각 col2 그룹의 행 개수를 계산합니다.

그룹화된 계열에 대해 max() 메서드를 사용하여 각 col2 그룹의 최대 개수를 가져옵니다.
  1. 예:
이 코드 조각은 df를 col2로 그룹화하고 개수를 계산한 다음 각 col2 값의 최대 개수를 찾습니다. 다음 출력에서:

이 출력에서 ​​각 col2 값은 col2에서 해당 값을 공유하는 최대 행 수와 연결됩니다.

위 내용은 Pandas DataFrame을 여러 열로 그룹화하고 계산하고 최대 개수를 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.