>  기사  >  백엔드 개발  >  Pandas DataFrame GroupBy를 사용하여 값 계산을 수행하고 여러 열의 최대 개수를 찾는 방법은 무엇입니까?

Pandas DataFrame GroupBy를 사용하여 값 계산을 수행하고 여러 열의 최대 개수를 찾는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-23 11:40:02633검색

How to Perform Value Counts and Find Maximum Counts for Multiple Columns Using Pandas DataFrame GroupBy?

값 계산을 위한 Pandas DataFrame GroupBy 다중 열

Pandas를 사용한 DataFrame 조작에서 데이터를 여러 열로 그룹화하면 귀중한 통찰력을 얻을 수 있습니다. 이 문서에서는 두 개의 열로 그룹화하면서 관찰값을 계산하는 방법과 각 그룹화의 최고 개수를 결정하는 방법을 보여줍니다.

여러 열이 있는 DataFrame이 있으면 그룹 데이터에 'groupby' 함수를 적용할 수 있습니다. 특정 열을 기반으로 합니다. 여기에는 'col1', 'col2', 'col3', 'col4' 및 'col5'의 5개 열이 있는 'df'라는 DataFrame이 있습니다.

<code class="python">import pandas as pd

df = pd.DataFrame([
    [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], 
    list('AAABBBBABCBDDD'), 
    [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], 
    ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],
    ['1','3','3','2','4','2','5','3','6','3','5','1','1','1']
]).T
df.columns = ['col1','col2','col3','col4','col5']</code>

행별 계산 그룹

각 행 그룹의 관찰 개수를 계산하려면 원하는 열에 'groupby' 기능을 사용한 후 'size' 기능을 적용하세요.

<code class="python">result = df.groupby(['col5', 'col2']).size()</code>

이것은 그룹화된 열을 인덱스로, 크기를 값으로 사용하여 DataFrame을 생성합니다.

<code class="python">print(result)</code>

가장 높은 개수 결정

각 항목의 최대 개수를 결정하려면 'col2' 값을 사용하려면 'col2'에 'groupby' 기능을 사용한 다음 그룹화된 데이터에 'max' 기능을 적용하세요.

<code class="python">result = df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>

이렇게 하면 각 'col2'에 대해 최대 개수를 갖는 시리즈가 생성됩니다. ' value.

<code class="python">print(result)</code>

요약하면 Pandas의 'groupby' 및 'size' 기능을 사용하면 데이터를 효율적으로 분석하고 집계할 수 있어 사용자가 다양한 방식으로 데이터에 대한 인사이트를 추출할 수 있습니다.

위 내용은 Pandas DataFrame GroupBy를 사용하여 값 계산을 수행하고 여러 열의 최대 개수를 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.