>  기사  >  백엔드 개발  >  DataFrame에서 부분 문자열 일치가 있는 열을 효율적으로 검색하는 방법은 무엇입니까?

DataFrame에서 부분 문자열 일치가 있는 열을 효율적으로 검색하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-20 14:02:02537검색

How to Efficiently Retrieve Columns with Partial String Matches in DataFrames?

부분 문자열 일치로 열을 효율적으로 검색

데이터 조작 영역에서는 데이터 프레임 내에서 특정 열을 찾는 것이 일반적으로 필요할 수 있습니다. . 그러나 열 이름 내에서 특정 패턴을 검색해야 하지만 정확한 일치를 무시해야 하는 경우에는 어떻게 해야 할까요? 예를 들어 'spike-2', 'hey spiked', 'spiked-in'과 같은 이름이 있고 'spike'가 포함된 열을 찾으려는 경우 몇 가지 장애물에 직면할 수 있습니다.

문제:

정확히 일치하지 않더라도 이름에 지정된 문자열이 포함된 열을 식별하는 것이 어려울 수 있습니다.

해결책:

이 문제를 극복하려면 데이터 프레임 열 전체에 걸쳐 포괄적인 루프를 사용하여 원하는 문자열에 대한 각 이름을 검사하세요. 이는 목록 이해를 통해 달성할 수 있습니다.

<code class="python">[col for col in df.columns if 'spike' in col]</code>

이 코드 조각은 지정된 조건을 충족하는 모든 열 이름으로 구성된 목록을 생성합니다.

예:

다음 데이터 프레임을 고려하세요.

<code class="python">data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]}
df = pd.DataFrame(data)
spike_cols = [col for col in df.columns if 'spike' in col]</code>

출력:

['spike-2', 'spiked-in']

대체 접근 방식:

더 간결한 솔루션을 위해 다음을 고려하세요. 필터 방법 사용:

<code class="python">df2 = df.filter(regex='spike')</code>

이 접근 방식을 사용하면 지정된 정규식 조건을 충족하는 열만 포함하는 데이터 프레임이 생성됩니다.

   spike-2  spiked-in
0        1          7
1        2          8
2        3          9

이러한 기술을 적용하면 열을 효율적으로 검색할 수 있습니다. 이름이 원하는 문자열과 정확히 일치하지 않는 경우에도 데이터프레임 내에서.

위 내용은 DataFrame에서 부분 문자열 일치가 있는 열을 효율적으로 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.