首页  >  文章  >  后端开发  >  如何对 Pandas 数据进行分组、计算出现次数并查找最大计数?

如何对 Pandas 数据进行分组、计算出现次数并查找最大计数?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-10-23 13:40:02626浏览

How to Group Pandas Data, Count Occurrences, and Find Maximum Counts?

Pandas 数据分组计数和最大计数检索

问题:

给定一个 Pandas DataFrame对于多列,如何按两个特定列有效地将行分组并获取每组中的计数?此外,如何确定分组列之一中每个值的最大计数?

解决方案:

按两列对 DataFrame 行进行分组并计算出现次数,使用 groupby() 函数,然后使用 size() 方法:

<code class="python">df.groupby(['col5', 'col2']).size()</code>

此操作根据指定的列创建组,并返回每个组中的行数。输出将类似于以下内容:

col5  col2  count
1     A       1
      D       3
2     B       2
...

要查找 col2 列中每个值的最大计数:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>

此操作按 col2 列级别对计数数据进行分组,并且返回每个 col2 值的最大计数,产生如下输出:

col2
A       3
B       2
C       1
D       3

附加说明:

按多列分组并获取计数和附加摘要统计信息,您可以将 groupby() 与 agg() 等其他方法结合使用,它允许您指定多个聚合函数:

<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>

以上是如何对 Pandas 数据进行分组、计算出现次数并查找最大计数?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn