Pandas에서 SQL의 'count(distinct)'와 동일한 연간 고유 클라이언트 수 찾기
SQL에서 연간 고유 클라이언트 수 계산 다음 쿼리를 사용하여 수행할 수 있습니다.
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
일반적으로 데이터베이스 대체품으로 사용되는 Pandas에서 유사한 작업을 수행하려면 groupby() 메서드와 함께 nunique() 함수를 사용할 수 있습니다.
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
이 코드 조각은 데이터 프레임 테이블을 'YEARMONTH' 열로 그룹화한 다음 nunique() 함수를 적용하여 각 연도의 고유 클라이언트 수를 계산합니다. 결과는 연도, 월을 인덱스로, 연간 고유 클라이언트 수를 값으로 사용하는 pandas 시리즈가 됩니다.
예를 들어 테이블에 다음 데이터가 포함되어 있는 경우:
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
nunique() 함수를 적용하면 다음과 같은 출력이 생성됩니다.
<code class="python">YEARMONTH 201301 2 201302 3</code>
이 결과는 201301에는 2개의 고유 클라이언트가 있고 201302에는 3개의 고유 클라이언트가 있음을 나타냅니다.
위 내용은 Pandas는 어떻게 매년 SQL\'count(distinct)\'와 동일한 클라이언트 계산을 달성할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!