>  기사  >  백엔드 개발  >  NumPy 배열에서 고유 값을 효율적으로 계산하는 방법은 무엇입니까?

NumPy 배열에서 고유 값을 효율적으로 계산하는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-10-26 12:31:02543검색

How to Efficiently Count Unique Values in a NumPy Array?

NumPy 배열에서 고유 값의 빈도 수를 효율적으로 결정

이 문서에서는 NumPy 배열 내에서 고유 값의 빈도 수를 계산하는 효율적인 방법을 살펴봅니다.

return_counts=True(NumPy 버전 1.9 이상)와 함께 numpy.unique를 사용하면 고유 값과 해당 개수를 모두 효율적으로 계산할 수 있습니다. 예시:

<code class="python">import numpy as np

x = np.array([1,1,1,2,2,2,5,25,1,1])
unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)</code>

이 접근 방식은 성능 벤치마크에서 볼 수 있듯이 실행 속도 측면에서 scipy.stats.itemfreq 기능보다 훨씬 뛰어납니다.

<code class="python">In [4]: x = np.random.random_integers(0,100,1e6)

In [5]: %timeit unique, counts = np.unique(x, return_counts=True)
10 loops, best of 3: 31.5 ms per loop

In [6]: %timeit scipy.stats.itemfreq(x)
10 loops, best of 3: 170 ms per loop</code>

위 내용은 NumPy 배열에서 고유 값을 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.