>백엔드 개발 >파이썬 튜토리얼 >하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?

하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-16 08:14:11982검색

How Can I Filter a Pandas DataFrame Based on Substring Matching?

Pandas DataFrame 하위 문자열 필터링

부분 문자열 일치를 기반으로 Pandas DataFrame을 필터링하는 것은 일반적인 데이터 조작 작업입니다. 이 목표를 달성하기 위해 Pandas 버전 0.8.1에 도입된 벡터화된 문자열 메서드는 우아한 솔루션을 제공합니다.

정규식을 사용하는 전통적인 접근 방식(예: 개별 셀을 확인하기 위한 re.search())과 달리 벡터화된 문자열 메서드를 사용하면 전체 열에서 효율적인 작업을 수행할 수 있습니다. 예를 들어 'A' 열에 하위 문자열 'hello'가 포함된 행을 선택하려면 다음을 사용할 수 있습니다. code:

df[df['A'].str.contains("hello")]

이 구문은 다양한 문자열 조작 기능을 제공하는 Series 객체의 str 속성을 활용합니다. contain() 메서드는 'A' 열의 각 요소가 있는지 여부를 나타내는 부울 마스크를 반환합니다. 지정된 하위 문자열을 포함합니다. 그런 다음 결과 마스크를 사용하여 DataFrame을 필터링하고 기준을 충족하는 행만 선택합니다.

이 방법은 부분 문자열 일치를 수행하는 간결하고 효율적인 방법을 제공합니다. pandas DataFrames, 데이터 필터링 작업을 간소화합니다.

위 내용은 하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.