>  기사  >  백엔드 개발  >  NumPy 배열을 효율적으로 그룹화하려면 어떻게 해야 합니까?

NumPy 배열을 효율적으로 그룹화하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-24 22:40:11977검색

How Can I Efficiently Group NumPy Arrays?

NumPy를 사용한 효율적인 배열 그룹화

NumPy는 배열 그룹화를 위해 특별히 설계된 기본 기능을 제공하지 않을 수 있지만 유사한 목표를 효과적으로 달성할 수 있는 다용도 기술입니다. 결과.

Eelco의 라이브러리에서 영감을 얻었습니다

한 가지 접근 방식은 Eelco Hoogendoorn의 라이브러리에서 영감을 얻어 입력 배열의 첫 번째 열이 단조 증가한다는 가정을 활용하여 이를 단순화합니다. . 그렇지 않은 경우 먼저 a = a[a[:, 0].argsort()]를 사용하여 정렬할 수 있습니다.

np.split(a[:, 1], np.unique(a[:, 0], return_index=True)[1][1:])

고유하게 그룹을 식별

이것은 스니펫은 np.unique()를 활용하여 첫 번째 열의 고유 값을 식별하고 해당 인덱스를 반환합니다. 이러한 인덱스는 두 번째 열을 각 그룹을 나타내는 별도의 하위 배열로 분할하는 데 사용됩니다.

시간 복잡도 및 성능

이 방법은 O(n) 복잡성을 나타내므로 매우 복잡합니다. 효율적인. 다양한 그룹 크기의 어레이에 대한 경험적 timeit 측정은 pandas, numpy-indexed 및 defaultdict와 같은 다른 접근 방식보다 성능 이점이 있음을 확인합니다.

대체 솔루션

제시된 접근 방식을 넘어서 , numpy_groupies와 같은 NumPy 기반 기술도 그룹화를 위해 탐색할 수 있습니다.

추가 고려 사항

입력 배열의 첫 번째 열이 정렬되지 않은 경우 그룹화하기 전에 정렬하는 것이 정확한 결과를 보장하는 것이 좋습니다. argsort와 같은 특정 정렬 알고리즘의 시간 복잡도는 O(n log(n))입니다.

위 내용은 NumPy 배열을 효율적으로 그룹화하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.