首页 >后端开发 >Python教程 >Pandas 中的 `groupby().count()` 和 `groupby().size()` 有什么区别?

Pandas 中的 `groupby().count()` 和 `groupby().size()` 有什么区别?

Linda Hamilton
Linda Hamilton原创
2024-11-28 17:38:11709浏览

What's the Difference Between `groupby().count()` and `groupby().size()` in Pandas?

理解 Pandas 中大小和计数的区别

Pandas 是一个强大的用于数据操作和分析的 Python 库,提供灵活的操作,例如按类别对数据进行分组。在处理分组数据时,理解 count 和 size 方法之间的区别至关重要。

问题:Pandas 中 groupby("x").count 和 groupby("x").size 的区别? size 是否仅仅排除空值?

答案:

count 和 size 之间的区别在于它们对 NaN 值的处理:

  • size: 包括 NaN 值,本质上提供每个中的观察总数组。
  • 计数: 排除 NaN 值,生成每个组的非空观测值的数量。

示例:

考虑以下熊猫DataFrame:

df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})

评估按 'a' 分组的 'b' 列的计数和大小方法:

print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())

输出:

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64

很明显,count 方法排除了第 4 组中的 NaN 值(其中 'a' 是2),而size方法则包含它。

以上是Pandas 中的 `groupby().count()` 和 `groupby().size()` 有什么区别?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn