Heim  >  Artikel  >  Backend-Entwicklung  >  Wie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?

Wie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?

Susan Sarandon
Susan SarandonOriginal
2024-10-20 13:58:29496Durchsuche

How to Extract Columns with Matching Substrings in pandas DataFrame Iteratively and Using Regular Expressions?

Identifizieren von Spalten, die bestimmte Teilzeichenfolgen enthalten

Um Spalten zu finden, deren Namen eine bestimmte Teilzeichenfolge enthalten, ohne dass eine genaue Übereinstimmung erforderlich ist, kann ein iterativer Ansatz verwendet werden . Dazu gehört die Untersuchung jedes Spaltennamens und die Identifizierung derjenigen, die das Suchkriterium erfüllen.

Stellen Sie sich einen DataFrame mit Spaltennamen wie „Spike-2“, „Hey Spike“ und „Spiked-In“ vor. Um die Spaltennamen zu extrahieren, die die Teilzeichenfolge „Spike“ enthalten, kann der folgende Python-Code verwendet werden:

<code class="python">import pandas as pd

# Initialize data
data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]}
df = pd.DataFrame(data)

# Iterate over column names and filter based on substring
spike_cols = [col for col in df.columns if 'spike' in col]

# Print resulting column names
print(spike_cols)</code>

In diesem Code:

  1. df.columns gibt eine Liste von Spalten zurück Namen.
  2. Das Listenverständnis [col for col in df.columns if 'spike' in col] iteriert über jeden Spaltennamen unter Verwendung der Variablen col und erstellt eine neue Liste, die nur Namen enthält, die die Teilzeichenfolge 'spike' enthalten. .
  3. Die resultierenden Spike_cols enthalten die gewünschten Spaltennamen, auf die später mit df['col_name'] oder df[col_name] zugegriffen werden kann.

Alternativ können Sie einen DataFrame mit erhalten nur die passenden Spalten:

<code class="python">df2 = df.filter(regex='spike')</code>

Dadurch wird df2 erstellt, das nur die Spalten enthält, deren Namen „Spike“ enthalten.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn