Python/NumPy 中无需双重排序的更快数组项目排名
在数据分析和机器学习中,通常需要对数组中的项目进行排名基于它们的值的数组。对数组进行双重排序以进行排名可能会非常耗时。
初始方法
常见方法示例如下:
<code class="python">import numpy as np # Sample array array = np.array([4, 2, 7, 1]) # Temporary array for sorting temp = array.argsort() # Rank computation ranks = np.arange(len(array))[temp.argsort()]</code>
此方法涉及两次排序操作,增加了其复杂性。
优化解决方案
为了避免双重排序,我们可以利用 NumPy 的 argsort() 函数两次:
<code class="python">array = np.array([4, 2, 7, 1]) # First argsort to obtain element order order = array.argsort() # Second argsort to obtain ranking ranks = order.argsort()</code>
说明
首先,我们使用argsort()来获取数组元素的顺序。然后,我们再次对结果顺序应用 argsort(),从而获得排名。
结论
这种优化技术显着提高了数组项排名的速度避免不必要的排序。对于高维数组,使用argsort中的axis参数来指定排序的轴。
以上是如何在 Python/NumPy 中高效地对数组项进行排序而无需双重排序?的详细内容。更多信息请关注PHP中文网其他相关文章!