>  기사  >  백엔드 개발  >  Pandas를 사용하여 열별로 그룹화된 고유 값을 계산하는 방법은 무엇입니까?

Pandas를 사용하여 열별로 그룹화된 고유 값을 계산하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-10-18 15:47:03827검색

How to Count Unique Values Grouped by a Column with Pandas?

Pandas를 사용하여 그룹당 고유 값 계산

특정 열로 그룹화된 고유 값을 계산하는 것은 데이터 분석에서 일반적인 작업입니다. Pandas는 이를 달성하기 위한 다양한 방법을 제공합니다.

귀하의 경우 'ID' 및 '도메인' 열이 있는 DataFrame이 있고 각 '도메인'에 대해 고유한 'ID' 값을 계산해야 합니다.

df.groupby['domain', 'ID'].count()' 사용:

이 메서드는 'ID' 및 '도메인' 그룹 모두에 대한 개수가 포함된 DataFrame을 반환합니다. . 그러나 고유한 'ID' 값뿐만 아니라 각 그룹의 행 수를 계산합니다.

`nunique()'를 사용한 솔루션:

df.groupby ('domain')['ID'].nunique()는 각 '도메인' 그룹에 대한 고유한 'ID' 개수를 계산합니다. 결과 DataFrame에는 '도메인' 열이 인덱스로, 개수가 새 열로 포함됩니다.

작은따옴표 제거:

'도메인' 열에 다음이 포함된 경우 작은따옴표는 그룹화하기 전에 df.domain.str.strip("'")을 사용하여 제거하세요.

열 이름 유지:

'ID'를 유지하려면 결과의 열 이름을 보려면 df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})를 사용하세요. 그러면 '도메인' 및 'ID'(고유 개수) 열이 있는 DataFrame이 생성됩니다.

위 내용은 Pandas를 사용하여 열별로 그룹화된 고유 값을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.