>백엔드 개발 >파이썬 튜토리얼 >부울 인덱싱을 사용하여 Pandas 데이터 개체를 효율적으로 필터링하는 방법은 무엇입니까?

부울 인덱싱을 사용하여 Pandas 데이터 개체를 효율적으로 필터링하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-10-20 11:57:30654검색

How to Efficiently Filter Pandas Data Objects Using Boolean Indexing?

부울 인덱싱을 사용하여 Pandas 데이터 프레임 및 시리즈를 효율적으로 필터링

데이터 분석 시나리오에서는 결과 범위를 좁히기 위해 여러 필터를 적용하는 것이 중요한 경우가 많습니다. 이 문서의 목표는 Pandas 데이터 개체에 대한 여러 비교 작업을 연결하는 효율적인 접근 방식을 다루는 것입니다.

도전

목표는 관계 연산자 사전을 처리하고 이를 특정 Pandas에 추가로 적용하는 것입니다. Series 또는 DataFrame으로 인해 필터링된 데이터 세트가 생성됩니다. 이 작업을 수행하려면 특히 대규모 데이터세트를 처리할 때 불필요한 데이터 복사를 최소화해야 합니다.

해결책: 부울 인덱싱

Pandas는 부울 인덱싱을 사용하여 데이터를 필터링하는 매우 효율적인 메커니즘을 제공합니다. 부울 인덱싱에는 논리적 조건을 생성한 다음 이러한 조건을 사용하여 데이터를 인덱싱하는 작업이 포함됩니다. 다음 예를 고려하십시오.

<code class="python">df.loc[df['col1'] >= 1, 'col1']</code>

이 코드 줄은 DataFrame df에서 'col1' 열의 값이 1보다 크거나 같은 모든 행을 선택합니다. 결과는 다음을 포함하는 새로운 Series 객체입니다. 필터링된 값입니다.

여러 필터를 적용하려면 &와 같은 논리 연산자를 사용하여 부울 조건을 결합할 수 있습니다. (및) 및 | (또는). 예를 들면 다음과 같습니다.

<code class="python">df[(df['col1'] >= 1) & (df['col1'] <= 1)]

이 작업은 'col1'이 1보다 크거나 같고 1보다 작거나 같은 행을 필터링합니다.

도우미 기능

여러 필터를 적용하는 프로세스를 단순화하기 위해 도우미 함수를 만들 수 있습니다.

<code class="python">def b(x, col, op, n): 
    return op(x[col], n)

def f(x, *b):
    return x[(np.logical_and(*b))]

b 함수는 지정된 열과 연산자에 대한 부울 조건을 생성하는 반면, f는 DataFrame 또는 시리즈에 여러 부울 조건을 적용합니다.

사용 예

이러한 기능을 사용하려면 필터 기준 사전을 제공할 수 있습니다.

<code class="python">filters = {'>=': [1], '<=': [1]}</code>
<code class="python">b1 = b(df, 'col1', ge, 1)
b2 = b(df, 'col1', le, 1)
filtered_df = f(df, b1, b2)</code>

이 코드는 'col1'에 필터를 적용합니다. DataFrame df의 열에 추가하고 필터링된 결과가 포함된 새 DataFrame을 반환합니다.

향상된 기능

Pandas 0.13에서는 문자열 표현식을 사용하여 필터를 적용하는 편리한 방법을 제공하는 쿼리 메서드를 도입했습니다. 유효한 열 식별자의 경우 다음 코드가 가능해집니다.

<code class="python">df.query('col1 <= 1 & 1 <= col1')</code>

이 줄은 보다 간결한 구문을 사용하여 이전 예와 동일한 필터링을 달성합니다.

부울 인덱싱 및 도우미 함수를 활용하여, Pandas 데이터프레임 및 시리즈에 여러 필터를 효율적으로 적용할 수 있습니다. 이 접근 방식은 특히 대규모 데이터 세트로 작업할 때 데이터 복사를 최소화하고 성능을 향상시킵니다.

위 내용은 부울 인덱싱을 사용하여 Pandas 데이터 개체를 효율적으로 필터링하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.