Pandas와 동일: 그룹별로 고유한 계산
Pandas를 데이터베이스 대안으로 사용할 때 고유한 계산과 같은 복잡한 작업을 수행해야 하는 경우가 많습니다. 그룹. 이 경우에는 연간 월간 개별 클라이언트 수를 계산하려고 합니다.
SQL에서는 count(distinct) 집계 함수를 사용하여 이를 수행할 수 있습니다. 그러나 Pandas는 이 작업에 약간 다른 구문을 제공합니다.
Pandas에서 연간 월별 고유 클라이언트 수를 계산하려면 다음 코드를 사용할 수 있습니다.
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
groupby() 함수 지정된 열(이 경우 YEARMONTH)을 기반으로 DataFrame을 그룹으로 분할합니다. 그런 다음 nunique() 함수는 각 그룹 내의 고유 값 수를 계산합니다.
다음은 설명을 위한 예입니다.
<code class="python">import pandas as pd # Create a DataFrame with sample data data = { 'YEARMONTH': ['201301', '201301', '201301', '201302', '201302', '201302', '201302'], 'CLIENTCODE': [1, 1, 2, 1, 2, 2, 3] } table = pd.DataFrame(data) # Count distinct clients per year month result = table.groupby('YEARMONTH').CLIENTCODE.nunique() print(result)</code>
출력:
YEARMONTH 201301 2 201302 3
결과는 SQL 쿼리의 예상 출력과 일치합니다.
위 내용은 Pandas에서 그룹별로 고유한 값을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!