집 >백엔드 개발 >파이썬 튜토리얼 >## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?

## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?

Susan Sarandon원래의: 2024-10-27 10:55:30426검색

## How to Efficiently Calculate Frequency Counts for Distinct Values in NumPy Arrays?

NumPy 배열에서 고유한 값의 빈도 수 계산

NumPy 배열 내 개별 값의 발생 빈도를 찾는 것은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 이러한 빈도 수를 얻는 효율적인 접근 방식을 설명합니다.

방법:

NumPy에서 빈도 수를 얻는 기본 방법은 np.unique 함수를 사용하는 것입니다. return_counts=True로 설정합니다. 예를 들어 다음 배열을 고려해보세요.

<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>

이러한 요소의 빈도 수를 계산하려면:

<code class="python">import numpy as np

unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)</code>

이 결과는 다음과 같습니다.

[[ 1  5]
 [ 2  3]
 [ 5  1]
 [25  1]]

결과 배열에는 고유한 값(첫 번째 열)과 해당 빈도(두 번째 열)가 포함되어 있습니다.

비교 및 성능:

return_counts=True인 np.unique 메소드는 scipy.stats.itemfreq와 같은 다른 접근 방식에 비해 향상된 성능을 제공합니다. 대규모 배열의 경우 다음 벤치마크 비교에서 알 수 있듯이 np.unique에 걸리는 시간이 크게 줄어듭니다.

<code class="python">x = np.random.random_integers(0,100,1e6)

%timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop

%timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>

결론:

np.unique NumPy의 함수는 배열에 있는 고유 값의 빈도 수를 얻기 위한 효율적인 솔루션을 제공합니다. 대체 방법에 비해 성능이 뛰어나 대규모 데이터 세트에 선호되는 선택입니다.

위 내용은 ## NumPy 배열의 고유한 값에 대한 빈도 수를 효율적으로 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

numpy scipy Array for function this column

성명：

이전 기사：고정된 합계와 균일한 분포를 보장하는 난수를 생성하는 방법은 무엇입니까?다음 기사：고정된 합계와 균일한 분포를 보장하는 난수를 생성하는 방법은 무엇입니까?