>백엔드 개발 >파이썬 튜토리얼 >두 열로 DataFrame을 그룹화하고, 발생 횟수를 계산하고, 최대 개수를 찾는 방법은 무엇입니까?

두 열로 DataFrame을 그룹화하고, 발생 횟수를 계산하고, 최대 개수를 찾는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-23 12:10:02609검색

How to Groupby DataFrame by Two Columns, Count Occurrences, and Find Maximum Count?

두 열로 Groupby DataFrame 및 검색 횟수

이 튜토리얼에서는 Pandas DataFrame에서 두 열의 조합 발생 횟수를 계산하고 식별하는 방법을 보여줍니다. 그룹화된 열 중 하나에 있는 각 고유 값의 최대 개수입니다.

문제 설명

다음 Pandas DataFrame df를 고려하세요.

<code class="python">df = pd.DataFrame([
    [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], 
    list('AAABBBBABCBDDD'), 
    [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], 
    ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],
    ['1','3','3','2','4','2','5','3','6','3','5','1','1','1']
]).T
df.columns = ['col1','col2','col3','col4','col5']</code>

횟수 발생

df에서 col5와 col2의 각 고유 조합 수를 얻으려면 groupby 함수와 크기 방법을 활용할 수 있습니다.

<code class="python">df.groupby(['col5', 'col2']).size()</code>

출력은 다음과 같습니다.

col5  col2
1     A       1
      D       3
2     B       2
etc...

각 col2 값의 최대 개수 찾기

각 col2 값의 최대 개수를 확인하려면 groupby 함수의 크기 방법을 사용하여 그룹 크기를 계산한 다음 첫 번째 수준에서 groupby를 사용하여 최대값을 찾을 수 있습니다. 각각의 고유한 col2 값에 대해:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>

이 결과는 다음과 같습니다.

col2
A       3
B       2
C       1
D       3
dtype: int64

위 내용은 두 열로 DataFrame을 그룹화하고, 발생 횟수를 계산하고, 최대 개수를 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.