首页  >  文章  >  后端开发  >  如果没有专用函数,如何在 NumPy 中实现 GroupBy 功能?

如果没有专用函数,如何在 NumPy 中实现 GroupBy 功能?

Susan Sarandon
Susan Sarandon原创
2024-11-26 04:38:13176浏览

How Can I Achieve GroupBy Functionality in NumPy Without a Dedicated Function?

NumPy 中的 GroupBy 功能

对数据进行分组是数据分析中的一项常见任务,允许您根据特定条件聚合和组织数据。虽然 NumPy 本身并不提供专用的分组功能,但您可以采取多种方法来实现此功能。

一种方法是将 np.split() 函数与 np.unique() 结合使用。此方法依赖于这样的假设:用作分组键的数组的第一列始终在增加。通过按此列对数组进行排序并获取唯一值,您可以随后使用 np.split() 将数组拆分为组。

例如,给定以下数组:

array([[1, 275],
       [1, 441],
       [1, 494],
       [1, 593],
       [2, 679],
       [2, 533],
       [2, 686],
       [3, 559],
       [3, 219],
       [3, 455],
       [4, 605],
       [4, 468],
       [4, 692],
       [4, 613]])

要按第一列对该数组进行分组,可以使用以下代码:

a = a[a[:, 0].argsort()]
np.split(a[:,1], np.unique(a[:, 0], return_index=True)[1][1:])

这将产生所需的输出:

array([[[275, 441, 494, 593]],
       [[679, 533, 686]],
       [[559, 219, 455]],
       [[605, 468, 692, 613]]], dtype=object)

这种方法有几个优点:

  • 它避免了显式循环的需要,使其更加高效。
  • 结果列表是 NumPy数组,允许进一步的 NumPy 操作而无需转换。
  • 它的复杂度为 O(n) (或O(n log(n)) with sorting)。

虽然 NumPy 本身可能没有特定的分组功能,但上述方法提供了对数据执行分组操作的有效方法,使您能够有效地组织和分析它。

以上是如果没有专用函数,如何在 NumPy 中实现 GroupBy 功能?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn