NumPy 배열 내 개별 값의 발생 빈도를 찾는 것은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 이러한 빈도 수를 얻는 효율적인 접근 방식을 설명합니다.
방법:
NumPy에서 빈도 수를 얻는 기본 방법은 np.unique 함수를 사용하는 것입니다. return_counts=True로 설정합니다. 예를 들어 다음 배열을 고려해보세요.
<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>
이러한 요소의 빈도 수를 계산하려면:
<code class="python">import numpy as np unique, counts = np.unique(x, return_counts=True) print(np.asarray((unique, counts)).T)</code>
이 결과는 다음과 같습니다.
[[ 1 5] [ 2 3] [ 5 1] [25 1]]
결과 배열에는 고유한 값(첫 번째 열)과 해당 빈도(두 번째 열)가 포함되어 있습니다.
비교 및 성능:
return_counts=True인 np.unique 메소드는 scipy.stats.itemfreq와 같은 다른 접근 방식에 비해 향상된 성능을 제공합니다. 대규모 배열의 경우 다음 벤치마크 비교에서 알 수 있듯이 np.unique에 걸리는 시간이 크게 줄어듭니다.
<code class="python">x = np.random.random_integers(0,100,1e6) %timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop %timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>
결론:
np.unique NumPy의 함수는 배열에 있는 고유 값의 빈도 수를 얻기 위한 효율적인 솔루션을 제공합니다. 대체 방법에 비해 성능이 뛰어나 대규모 데이터 세트에 선호되는 선택입니다.
위 내용은 ## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!