>백엔드 개발 >파이썬 튜토리얼 >하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?

하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-21 01:29:18168검색

How Can I Filter a Pandas DataFrame Based on Substring Matches?

하위 문자열 기준으로 Pandas DataFrame 필터링

문자열 값이 포함된 열이 있는 DataFrame이 있다고 가정합니다. 정규식에서 re.search(pattern, cell_in_question) 관용구를 사용하는 것과 유사하게 부분 문자열 일치를 기반으로 행을 선택해야 할 수도 있습니다. df[df['A'] == "hello world"] 구문에 익숙하지만 'hello'와 같은 부분 문자열 일치에 대해 이를 달성하는 방법을 찾는 것은 어려울 수 있습니다.

해결책 벡터화된 문자열 방법, 특히 Series.str을 활용하는 데 있습니다. 이 접근 방식을 사용하면 다음 작업을 수행할 수 있습니다.

df[df['A'].str.contains("hello")]

이 코드 줄은 'A' 열에 하위 문자열 "hello"가 포함된 DataFrame 행의 하위 집합을 반환합니다. 이 기능은 Pandas 버전 0.8.1 및 후속 버전에서 사용할 수 있다는 점에 유의하는 것이 중요합니다.

위 내용은 하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.