>  기사  >  백엔드 개발  >  Pandas에서 nunique()를 사용하여 그룹 내의 고유 값을 계산하는 방법은 무엇입니까?

Pandas에서 nunique()를 사용하여 그룹 내의 고유 값을 계산하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-18 15:44:03533검색

How to Count Unique Values Within Groups Using nunique() in Pandas?

Counting Unique Values per Group in Pandas with nunique

In pandas, counting unique values in a group is possible using the nunique() method. This is particularly useful when working with data where you need to determine the number of distinct values within specific categories or groups.

Problem:

Consider a DataFrame with the following data:

ID domain
123 vk.com
123 vk.com
123 twitter.com
456 vk.com
456 facebook.com
456 vk.com
456 google.com
789 twitter.com
789 vk.com

The task is to count the unique IDs for each domain in this DataFrame.

Solution:

To count unique values per group, use the nunique() method with the desired grouping columns. In this case, the domain column represents the groups:

<code class="python">df = df.groupby('domain')['ID'].nunique()
print(df)</code>

Output:

domain count
facebook.com 1
google.com 1
twitter.com 2
vk.com 3

Additional Considerations:

  • To remove any single quotes (') from the domain values, use the str.strip("'") method before grouping.
  • To preserve the column name, use the as_index=False argument in groupby() and pass the nunique() method to the agg() function.

위 내용은 Pandas에서 nunique()를 사용하여 그룹 내의 고유 값을 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.