>  기사  >  백엔드 개발  >  Pandas DataFrame에서 일치하는 하위 문자열이 있는 열을 반복적으로 추출하고 정규 표현식을 사용하는 방법은 무엇입니까?

Pandas DataFrame에서 일치하는 하위 문자열이 있는 열을 반복적으로 추출하고 정규 표현식을 사용하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-20 13:58:29496검색

How to Extract Columns with Matching Substrings in pandas DataFrame Iteratively and Using Regular Expressions?

특정 하위 문자열이 포함된 열 식별

완전히 일치할 필요 없이 이름에 지정된 하위 문자열이 포함된 열을 찾으려면 반복 접근 방식을 사용할 수 있습니다. . 여기에는 각 열 이름을 검사하고 검색 기준을 충족하는 항목을 식별하는 작업이 포함됩니다.

'spike-2', 'hey spik' 및 'spiked-in'과 같은 열 이름이 있는 DataFrame을 생각해 보세요. 하위 문자열 'spike'가 포함된 열 이름을 추출하려면 다음 Python 코드를 활용할 수 있습니다.

<code class="python">import pandas as pd

# Initialize data
data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]}
df = pd.DataFrame(data)

# Iterate over column names and filter based on substring
spike_cols = [col for col in df.columns if 'spike' in col]

# Print resulting column names
print(spike_cols)</code>

이 코드에서:

  1. df.columns는 열 목록을 반환합니다. names.
  2. 목록 이해 [col for col in df.columns if 'spike' in col]는 col 변수를 사용하여 각 열 이름을 반복하고 하위 문자열 'spike'를 포함하는 이름만 포함하는 새 목록을 구성합니다. .
  3. 결과 스파이크_cols에는 원하는 열 이름이 포함되어 있으며 나중에 df['col_name'] 또는 df[col_name]을 사용하여 액세스할 수 있습니다.

또는 다음을 사용하여 DataFrame을 얻으려면 일치하는 열만:

<code class="python">df2 = df.filter(regex='spike')</code>

이렇게 하면 이름에 'spike'가 포함된 열만 포함하는 df2가 생성됩니다.

위 내용은 Pandas DataFrame에서 일치하는 하위 문자열이 있는 열을 반복적으로 추출하고 정규 표현식을 사용하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.