>백엔드 개발 >파이썬 튜토리얼 >Pandas의 그룹화된 데이터 프레임에 그룹 개수가 포함된 열을 추가하는 방법은 무엇입니까?

Pandas의 그룹화된 데이터 프레임에 그룹 개수가 포함된 열을 추가하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-19 12:21:29435검색

How to Add a Column with Group Counts to a Grouped Dataframe in Pandas?

Pandas에서 그룹화된 데이터 프레임에 열을 추가하는 방법

데이터 분석에서는 데이터를 그룹화하고 계산을 수행해야 하는 경우가 많습니다. 각 그룹. Pandas는 그룹별 기능을 통해 이를 수행하는 편리한 방법을 제공합니다. 일반적인 작업 중 하나는 각 그룹 내의 열 값을 계산하고 이러한 개수를 포함하는 열을 데이터 프레임에 추가하는 것입니다.

데이터 프레임 df를 고려하세요.

<code class="python">df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})</code>

값을 계산하려면 각 c에 대해 유형을 입력하면 그룹화된 데이터 프레임에서 value_counts 함수를 사용할 수 있습니다.

<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>

이렇게 하면 그룹 개수가 포함된 새 데이터 프레임 g가 생성됩니다. 각 그룹의 크기와 함께 g에 열을 추가하려면 변환 함수를 사용할 수 있습니다.

<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>

transform은 원래 데이터 프레임의 각 그룹에 함수를 적용하고 인덱스가 정렬된 Series를 반환합니다. 원본 데이터 프레임. 이 경우에는 크기 함수를 사용하여 각 그룹의 요소 수를 계산하고 이를 새 열 크기에 할당합니다. 이제 결과 데이터프레임 g는 다음과 같습니다.

<code class="python">   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4</code>

이는 그룹별 집계 결과를 기반으로 그룹화된 데이터프레임에 새 열을 추가하는 간단한 방법을 보여줍니다.

위 내용은 Pandas의 그룹화된 데이터 프레임에 그룹 개수가 포함된 열을 추가하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.