首页  >  文章  >  后端开发  >  Pandas 如何实现每年相当于 SQL 的“count(distinct)”的客户端计数?

Pandas 如何实现每年相当于 SQL 的“count(distinct)”的客户端计数?

DDD
DDD原创
2024-10-23 15:13:02255浏览

How Can Pandas Achieve Client Counting Equivalent to SQL's 'count(distinct)' for Each Year?

在 Pandas 中查找每年的唯一客户端计数,相当于 SQL 的“count(distinct)”

在 SQL 中,计算每年的不同客户端可以通过以下查询来实现:

<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>

要在通常用作数据库替代品的 Pandas 中执行类似的操作,您可以使用 nunique() 函数和 groupby() 方法:

<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>

此代码片段按“YEARMONTH”列对数据框表进行分组,然后应用 nunique() 函数来计算每年的唯一客户端数。结果将是一个 pandas 系列,以年月为索引,以每年的唯一客户端数量为值。

例如,如果您的表包含以下数据:

CLIENTCODE YEARMONTH
1 201301
1 201301
2 201301
1 201302
2 201302
2 201302
3 201302

应用 nunique() 函数将产生以下输出:

<code class="python">YEARMONTH
201301       2
201302       3</code>

此结果表明,对于 201301,有 2 个唯一客户端,对于 201302,有 3 个唯一客户端。

以上是Pandas 如何实现每年相当于 SQL 的“count(distinct)”的客户端计数?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn