Pandas DataFrame 하위 문자열 필터링
부분 문자열 일치를 기반으로 Pandas DataFrame을 필터링하는 것은 일반적인 데이터 조작 작업입니다. 이 목표를 달성하기 위해 Pandas 버전 0.8.1에 도입된 벡터화된 문자열 메서드는 우아한 솔루션을 제공합니다.
정규식을 사용하는 전통적인 접근 방식(예: 개별 셀을 확인하기 위한 re.search())과 달리 벡터화된 문자열 메서드를 사용하면 전체 열에서 효율적인 작업을 수행할 수 있습니다. 예를 들어 'A' 열에 하위 문자열 'hello'가 포함된 행을 선택하려면 다음을 사용할 수 있습니다. code:
df[df['A'].str.contains("hello")]
이 구문은 다양한 문자열 조작 기능을 제공하는 Series 객체의 str 속성을 활용합니다. contain() 메서드는 'A' 열의 각 요소가 있는지 여부를 나타내는 부울 마스크를 반환합니다. 지정된 하위 문자열을 포함합니다. 그런 다음 결과 마스크를 사용하여 DataFrame을 필터링하고 기준을 충족하는 행만 선택합니다.
이 방법은 부분 문자열 일치를 수행하는 간결하고 효율적인 방법을 제공합니다. pandas DataFrames, 데이터 필터링 작업을 간소화합니다.
위 내용은 하위 문자열 일치를 기반으로 Pandas DataFrame을 필터링하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!