>  기사  >  백엔드 개발  >  Pandas는 어떻게 매년 SQL\'count(distinct)\'와 동일한 클라이언트 계산을 달성할 수 있습니까?

Pandas는 어떻게 매년 SQL\'count(distinct)\'와 동일한 클라이언트 계산을 달성할 수 있습니까?

DDD
DDD원래의
2024-10-23 15:13:02255검색

How Can Pandas Achieve Client Counting Equivalent to SQL's 'count(distinct)' for Each Year?

Pandas에서 SQL의 'count(distinct)'와 동일한 연간 고유 클라이언트 수 찾기

SQL에서 연간 고유 클라이언트 수 계산 다음 쿼리를 사용하여 수행할 수 있습니다.

<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>

일반적으로 데이터베이스 대체품으로 사용되는 Pandas에서 유사한 작업을 수행하려면 groupby() 메서드와 함께 nunique() 함수를 사용할 수 있습니다.

<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>

이 코드 조각은 데이터 프레임 테이블을 'YEARMONTH' 열로 그룹화한 다음 nunique() 함수를 적용하여 각 연도의 고유 클라이언트 수를 계산합니다. 결과는 연도, 월을 인덱스로, 연간 고유 클라이언트 수를 값으로 사용하는 pandas 시리즈가 됩니다.

예를 들어 테이블에 다음 데이터가 포함되어 있는 경우:

CLIENTCODE YEARMONTH
1 201301
1 201301
2 201301
1 201302
2 201302
2 201302
3 201302

nunique() 함수를 적용하면 다음과 같은 출력이 생성됩니다.

<code class="python">YEARMONTH
201301       2
201302       3</code>

이 결과는 201301에는 2개의 고유 클라이언트가 있고 201302에는 3개의 고유 클라이언트가 있음을 나타냅니다.

위 내용은 Pandas는 어떻게 매년 SQL\'count(distinct)\'와 동일한 클라이언트 계산을 달성할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.