>백엔드 개발 >파이썬 튜토리얼 >## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?

## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-27 10:55:30362검색

## How to Efficiently Calculate Frequency Counts for Distinct Values in NumPy Arrays?

NumPy 배열에서 고유한 값의 빈도 수 계산

NumPy 배열 내 개별 값의 발생 빈도를 찾는 것은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 이러한 빈도 수를 얻는 효율적인 접근 방식을 설명합니다.

방법:

NumPy에서 빈도 수를 얻는 기본 방법은 np.unique 함수를 사용하는 것입니다. return_counts=True로 설정합니다. 예를 들어 다음 배열을 고려해보세요.

<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>

이러한 요소의 빈도 수를 계산하려면:

<code class="python">import numpy as np

unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)</code>

이 결과는 다음과 같습니다.

[[ 1  5]
 [ 2  3]
 [ 5  1]
 [25  1]]

결과 배열에는 고유한 값(첫 번째 열)과 해당 빈도(두 번째 열)가 포함되어 있습니다.

비교 및 성능:

return_counts=True인 np.unique 메소드는 scipy.stats.itemfreq와 같은 다른 접근 방식에 비해 향상된 성능을 제공합니다. 대규모 배열의 경우 다음 벤치마크 비교에서 알 수 있듯이 np.unique에 걸리는 시간이 크게 줄어듭니다.

<code class="python">x = np.random.random_integers(0,100,1e6)

%timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop

%timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>

결론:

np.unique NumPy의 함수는 배열에 있는 고유 값의 빈도 수를 얻기 위한 효율적인 솔루션을 제공합니다. 대체 방법에 비해 성능이 뛰어나 대규모 데이터 세트에 선호되는 선택입니다.

위 내용은 ## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.