>백엔드 개발 >파이썬 튜토리얼 >Pandas에서 그룹별로 고유한 값을 계산하는 방법은 무엇입니까?

Pandas에서 그룹별로 고유한 값을 계산하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-23 13:23:01694검색

How to Count Distinct Values by Group in Pandas?

Pandas와 동일: 그룹별로 고유한 계산

Pandas를 데이터베이스 대안으로 사용할 때 고유한 계산과 같은 복잡한 작업을 수행해야 하는 경우가 많습니다. 그룹. 이 경우에는 연간 월간 개별 클라이언트 수를 계산하려고 합니다.

SQL에서는 count(distinct) 집계 함수를 사용하여 이를 수행할 수 있습니다. 그러나 Pandas는 이 작업에 약간 다른 구문을 제공합니다.

Pandas에서 연간 월별 고유 클라이언트 수를 계산하려면 다음 코드를 사용할 수 있습니다.

<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>

groupby() 함수 지정된 열(이 경우 YEARMONTH)을 기반으로 DataFrame을 그룹으로 분할합니다. 그런 다음 nunique() 함수는 각 그룹 내의 고유 값 수를 계산합니다.

다음은 설명을 위한 예입니다.

<code class="python">import pandas as pd

# Create a DataFrame with sample data
data = {
    'YEARMONTH': ['201301', '201301', '201301', '201302', '201302', '201302', '201302'],
    'CLIENTCODE': [1, 1, 2, 1, 2, 2, 3]
}
table = pd.DataFrame(data)

# Count distinct clients per year month
result = table.groupby('YEARMONTH').CLIENTCODE.nunique()

print(result)</code>

출력:

YEARMONTH
201301    2
201302    3

결과는 SQL 쿼리의 예상 출력과 일치합니다.

위 내용은 Pandas에서 그룹별로 고유한 값을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.