NumPy 中的 GroupBy 功能
对数据进行分组是数据分析中的一项常见任务,允许您根据特定条件聚合和组织数据。虽然 NumPy 本身并不提供专用的分组功能,但您可以采取多种方法来实现此功能。
一种方法是将 np.split() 函数与 np.unique() 结合使用。此方法依赖于这样的假设:用作分组键的数组的第一列始终在增加。通过按此列对数组进行排序并获取唯一值,您可以随后使用 np.split() 将数组拆分为组。
例如,给定以下数组:
array([[1, 275], [1, 441], [1, 494], [1, 593], [2, 679], [2, 533], [2, 686], [3, 559], [3, 219], [3, 455], [4, 605], [4, 468], [4, 692], [4, 613]])
要按第一列对该数组进行分组,可以使用以下代码:
a = a[a[:, 0].argsort()] np.split(a[:,1], np.unique(a[:, 0], return_index=True)[1][1:])
这将产生所需的输出:
array([[[275, 441, 494, 593]], [[679, 533, 686]], [[559, 219, 455]], [[605, 468, 692, 613]]], dtype=object)
这种方法有几个优点:
虽然 NumPy 本身可能没有特定的分组功能,但上述方法提供了对数据执行分组操作的有效方法,使您能够有效地组织和分析它。
以上是如果没有专用函数,如何在 NumPy 中实现 GroupBy 功能?的详细内容。更多信息请关注PHP中文网其他相关文章!