>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame을 두 열로 그룹화하고 관찰 횟수를 계산하는 방법은 무엇입니까?

Pandas DataFrame을 두 열로 그룹화하고 관찰 횟수를 계산하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-23 10:56:12708검색

How to Group Pandas DataFrame by Two Columns and Count Observations?

Pandas DataFrame: 두 열로 그룹화 및 관찰 횟수 계산

데이터 분석에서는 특정 열과 데이터를 기반으로 데이터를 그룹화해야 하는 경우가 많습니다. 각 그룹 내의 관측치 수를 셉니다. Pandas DataFrame을 사용하여 이를 달성하려면 다음 문제를 자세히 살펴보겠습니다.

문제 설명:

여러 열이 있는 Pandas DataFrame을 생각해 보세요. 목표는 두 개의 열, 즉 'col5'와 'col2'를 기반으로 DataFrame을 그룹화하고 각 그룹 내의 고유 행 수를 계산하는 것입니다. 또한 각 'col2' 값의 최대 개수를 결정하려고 합니다.

해결책:

DataFrame을 그룹화하고 각 그룹의 행 수를 계산하려면 다음을 수행합니다. Pandas groupby() 함수를 활용하세요. 단계별 접근 방식은 다음과 같습니다.

1단계: DataFrame 그룹화

'col5' 및 'col2' 열을 기준으로 DataFrame 그룹화:

<code class="python">grouped_df = df.groupby(['col5', 'col2'])</code>

2단계: 행 계산

그룹화된 DataFrame에 size() 함수를 적용하여 각 그룹의 고유 행 수를 계산합니다.

<code class="python">counts = grouped_df.size()</code>

3단계: 각 'col2'의 최대 개수 찾기

각 'col2' 값의 최대 개수를 찾으려면 DataFrame 개수를 'col2'별로 그룹화한 다음 max() 함수를 적용합니다:

<code class="python">max_counts = counts.groupby(level=1).max()</code>

출력:

위 단계는 두 개의 별도 DataFrame을 제공합니다:

  • counts: 각 그룹의 고유 행 수를 표시합니다.
  • max_counts: 각 'col2' 값의 최대 개수를 표시합니다.

위 내용은 Pandas DataFrame을 두 열로 그룹화하고 관찰 횟수를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.