하위 문자열 기준으로 Pandas DataFrame 필터링
문자열 값이 포함된 열이 있는 DataFrame이 있다고 가정합니다. 정규식에서 re.search(pattern, cell_in_question) 관용구를 사용하는 것과 유사하게 부분 문자열 일치를 기반으로 행을 선택해야 할 수도 있습니다. df[df['A'] == "hello world"] 구문에 익숙하지만 'hello'와 같은 부분 문자열 일치에 대해 이를 달성하는 방법을 찾는 것은 어려울 수 있습니다.
해결책 벡터화된 문자열 방법, 특히 Series.str을 활용하는 데 있습니다. 이 접근 방식을 사용하면 다음 작업을 수행할 수 있습니다.
df[df['A'].str.contains("hello")]
이 코드 줄은 'A' 열에 하위 문자열 "hello"가 포함된 DataFrame 행의 하위 집합을 반환합니다. 이 기능은 Pandas 버전 0.8.1 및 후속 버전에서 사용할 수 있다는 점에 유의하는 것이 중요합니다.
위 내용은 하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!