집 >백엔드 개발 >파이썬 튜토리얼 >Pandas를 사용하여 열별로 그룹화된 고유 값을 계산하는 방법은 무엇입니까?

Pandas를 사용하여 열별로 그룹화된 고유 값을 계산하는 방법은 무엇입니까?

Patricia Arquette원래의: 2024-10-18 15:47:03913검색

How to Count Unique Values Grouped by a Column with Pandas?

Pandas를 사용하여 그룹당 고유 값 계산

특정 열로 그룹화된 고유 값을 계산하는 것은 데이터 분석에서 일반적인 작업입니다. Pandas는 이를 달성하기 위한 다양한 방법을 제공합니다.

귀하의 경우 'ID' 및 '도메인' 열이 있는 DataFrame이 있고 각 '도메인'에 대해 고유한 'ID' 값을 계산해야 합니다.

df.groupby['domain', 'ID'].count()' 사용:

이 메서드는 'ID' 및 '도메인' 그룹 모두에 대한 개수가 포함된 DataFrame을 반환합니다. . 그러나 고유한 'ID' 값뿐만 아니라 각 그룹의 행 수를 계산합니다.

`nunique()'를 사용한 솔루션:

df.groupby ('domain')['ID'].nunique()는 각 '도메인' 그룹에 대한 고유한 'ID' 개수를 계산합니다. 결과 DataFrame에는 '도메인' 열이 인덱스로, 개수가 새 열로 포함됩니다.

작은따옴표 제거:

'도메인' 열에 다음이 포함된 경우 작은따옴표는 그룹화하기 전에 df.domain.str.strip("'")을 사용하여 제거하세요.

열 이름 유지:

'ID'를 유지하려면 결과의 열 이름을 보려면 df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})를 사용하세요. 그러면 '도메인' 및 'ID'(고유 개수) 열이 있는 DataFrame이 생성됩니다.

위 내용은 Pandas를 사용하여 열별로 그룹화된 고유 값을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

pandas if count for using number this column

성명：

이전 기사：Pandas에서 nunique()를 사용하여 그룹 내의 고유 값을 계산하는 방법은 무엇입니까?다음 기사：Pandas에서 nunique()를 사용하여 그룹 내의 고유 값을 계산하는 방법은 무엇입니까?