首页  >  文章  >  后端开发  >  如何使用“nunique()”在 Pandas 中执行等效的 SQL“count(distinct)”?

如何使用“nunique()”在 Pandas 中执行等效的 SQL“count(distinct)”?

Barbara Streisand
Barbara Streisand原创
2024-10-23 13:28:29306浏览

How to Perform SQL 'count(distinct)' Equivalent in Pandas using 'nunique()'?

使用 'count(distinct)' 在 Pandas 中等效的 SQL 查询

在 SQL 中,可以使用以下方法来实现计算列中的不同值“计数(不同)”功能。例如,要计算每年每月的唯一客户端代码:

<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>

可以在分组 DataFrame 上使用“nunique()”方法在 Pandas 中执行类似的操作。通过按“YEARMONTH”列对数据进行分组,然后对“CLIENTCODE”列调用“nunique()”,我们可以获得每年每月的唯一客户数量。

<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>

示例:

考虑一个包含以下列的 DataFrame “表”:

CLIENTCODE YEARMONTH
1 201301
1 201301
2 201301
1 201302
2 201302
2 201302
3 201302

应用上述代码会产生:

<code class="python">Out[3]: 
YEARMONTH
201301       2
201302       3</code>

此输出与预期匹配结果,显示每年每月的唯一客户数量。

以上是如何使用“nunique()”在 Pandas 中执行等效的 SQL“count(distinct)”?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn