首页  >  文章  >  后端开发  >  如何在 Pandas 中使用 nunique() 计算组内的唯一值?

如何在 Pandas 中使用 nunique() 计算组内的唯一值?

Susan Sarandon
Susan Sarandon原创
2024-10-18 15:44:03461浏览

How to Count Unique Values Within Groups Using nunique() in Pandas?

使用 nunique 计算 Pandas 中每组的唯一值

在 pandas 中,可以使用 nunique() 方法计算组中的唯一值。当您需要确定特定类别或组内不同值的数量时,这特别有用。

问题:

考虑具有以下内容的 DataFrame数据:

ID domain
123 vk.com
123 vk.com
123 twitter.com
456 vk.com
456 facebook.com
456 vk.com
456 google.com
789 twitter.com
789 vk.com

任务是计算此 DataFrame 中每个域的唯一 ID。

解决方案:

计算唯一值每组,使用 nunique() 方法和所需的分组列。在本例中,域列代表组:

<code class="python">df = df.groupby('domain')['ID'].nunique()
print(df)</code>

输出:

domain count
facebook.com 1
google.com 1
twitter.com 2
vk.com 3

其他注意事项:

  • 要从域值中删除任何单引号 ('),请在分组之前使用 str.strip("'") 方法。
  • 要保留列名称,请使用 as_index=False 参数在 groupby() 中并将 nunique() 方法传递给 agg() 函数。

以上是如何在 Pandas 中使用 nunique() 计算组内的唯一值?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn