>백엔드 개발 >파이썬 튜토리얼 >NumPy 배열에서 주어진 보폭으로 하위 배열을 효율적으로 추출하는 방법은 무엇입니까?

NumPy 배열에서 주어진 보폭으로 하위 배열을 효율적으로 추출하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-09 21:18:10828검색

How to Efficiently Extract Subarrays with a Given Stride from a NumPy Array?

주어진 스트라이드/단계 크기를 사용하여 Numpy 배열에서 효율적으로 하위 배열 가져오기

데이터 분석의 세계에서는 종종 특정 매개변수를 사용하여 하위 배열을 추출해야 합니다. 더 큰 배열의 보폭 또는 단계 크기. 수치 연산을 위한 인기 있는 Python 라이브러리인 Numpy는 이를 효율적으로 달성하기 위한 여러 가지 방법을 제공합니다.

문제 설명:
주어진 Numpy 배열에서 다음의 하위 배열 행렬을 추출하려고 합니다. 특정 보폭 또는 단계 크기를 갖는 고정 길이. 스트라이드는 연속된 하위 배열의 시작 사이의 거리입니다.

토론:

하위 배열을 생성하는 간단한 방법 중 하나는 for 루프를 사용하여 원래 배열을 반복하는 것입니다. . 이 접근 방식은 효과가 있지만 대규모 배열의 경우 속도가 느릴 수 있습니다.

접근 방식 1: 브로드캐스팅

NumPy의 브로드캐스팅 메커니즘을 사용하면 루프 없이 하위 배열을 생성할 수 있습니다. 배열, 하위 배열 길이(L) 및 스트라이드(S)를 취하는 다음 함수를 사용할 수 있습니다.

def broadcasting_app(a, L, S):
    nrows = ((a.size - L) // S) + 1
    return a[S * np.arange(nrows)[:, None] + np.arange(L)]

설명:
np.arange(nrows)가 생성합니다. stride가 1인 인덱스 배열입니다. 이것을 S와 곱하면 각 하위 배열의 시작 인덱스를 얻습니다. 그런 다음 이 인덱스를 a 행에 브로드캐스트하여 하위 배열을 얻습니다.

접근 방법 2: NumPy Strides

또 다른 효율적인 방법은 NumPy의 strides 기능을 사용합니다. 스트라이드는 각 축을 따라 연속된 요소 사이의 바이트 수를 나타냅니다. 이 정보를 사용하여 하위 배열을 만들 수 있습니다.

def strided_app(a, L, S):
    nrows = ((a.size - L) // S) + 1
    n = a.strides[0]
    return np.lib.stride_tricks.as_strided(a, shape=(nrows, L), strides=(S * n, n))

설명:
np.lib.stride_tricks.as_strided를 사용하여 보폭을 활용하여 모양을 변경합니다. 결과 배열은 S의 스트라이드를 유지하면서 원하는 행 수(nrows)와 하위 배열 길이(L)를 갖습니다.

샘플 코드:

접근 방식:

a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])

print(broadcasting_app(a, L=5, S=3))
print(strided_app(a, L=5, S=3))

출력:

[[ 1  2  3  4  5]
 [ 4  5  6  7  8]
 [ 7  8  9 10 11]]
[[ 1  2  3  4  5]
 [ 4  5  6  7  8]
 [ 7  8  9 10 11]]

두 접근 방식 모두 원하는 보폭으로 하위 배열 행렬을 효율적으로 생성합니다.

위 내용은 NumPy 배열에서 주어진 보폭으로 하위 배열을 효율적으로 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.