>백엔드 개발 >파이썬 튜토리얼 >열 값을 기반으로 Pandas DataFrame에서 행을 효율적으로 선택하려면 어떻게 해야 합니까?

열 값을 기반으로 Pandas DataFrame에서 행을 효율적으로 선택하려면 어떻게 해야 합니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-25 16:02:15736검색

How Can I Efficiently Select Rows in a Pandas DataFrame Based on Column Values?

Pandas의 열 값을 기반으로 행 선택

관계형 데이터베이스와 마찬가지로 특정 열의 값을 기반으로 DataFrame에서 특정 행을 선택해야 할 수도 있습니다. Pandas에서 이를 원활하게 수행하려면 여러 가지 방법을 사용할 수 있습니다.

== 및 isin으로 필터링

열 값이 특정 값과 일치하는 행을 검색하려면 == 연산자를 활용하세요.

df.loc[df['column_name'] == some_value]

반대로, 열 값이 값 모음에 속하는 행을 선택하려면 다음을 사용하세요. isin:

df.loc[df['column_name'].isin(some_values)]

&로 조건 결합

선택 항목에서 여러 조건을 결합하려면 &:

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

으로 연결하세요. 참고: 여기서 괄호는 적절한 평가를 위해 매우 중요합니다.

!= 및 값을 제외합니다. ~

특정 열 값이 있는 행을 제외하려면 !=:

df.loc[df['column_name'] != some_value]

또는 특정 범위를 벗어나는 값의 경우 ~:

df = df.loc[~df['column_name'].isin(some_values)] # .loc is not in-place replacement
를 사용하여 isin 결과를 무효화합니다.

예시 적용

다음 사항을 고려하세요. DataFrame:

import pandas as pd
import numpy as np
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
                   'B': 'one one two three two two one three'.split(),
                   'C': np.arange(8), 'D': np.arange(8) * 2})
print(df)

'A' 값이 'foo'인 행 선택:

print(df.loc[df['A'] == 'foo'])

'B' 값이 '1' 또는 '3'인 행 선택:

print(df.loc[df['B'].isin(['one','three'])])

인덱싱으로 성능 향상

빈번한 필터링 작업의 경우 생성하는 것이 더 효율적입니다. 먼저 인덱스를 작성하세요:

df = df.set_index(['B'])
print(df.loc['one'])

또는 df.index.isin을 사용하세요:

df.loc[df.index.isin(['one','two'])]

위 내용은 열 값을 기반으로 Pandas DataFrame에서 행을 효율적으로 선택하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.