Heim  >  Artikel  >  Backend-Entwicklung  >  Wie extrahiere ich Spalten mit teilweisen Zeichenfolgenübereinstimmungen in einem DataFrame?

Wie extrahiere ich Spalten mit teilweisen Zeichenfolgenübereinstimmungen in einem DataFrame?

Barbara Streisand
Barbara StreisandOriginal
2024-10-20 14:00:03841Durchsuche

How to Extract Columns With Partial String Matches in a DataFrame?

Spalten mit teilweisen Zeichenfolgenübereinstimmungen finden

Das Abfragen eines DataFrame nach Spalten, die eine bestimmte Zeichenfolge enthalten, kann eine nützliche Operation sein. Was aber, wenn die Übereinstimmung nicht genau ist, aber eine bestimmte Teilzeichenfolge enthält? Hier kommt der Regex-Filter ins Spiel.

Um Spalten mit Namen zu finden, die eine bestimmte Zeichenfolge, insbesondere eine fortlaufende Teilzeichenfolge, enthalten, ziehen Sie die folgende Lösung in Betracht:

<code class="python">import pandas as pd

# Create a DataFrame to demonstrate
data = {'spike-2': [1, 2, 3], 'hey spke': [4, 5, 6], 'spiked-in': [7, 8, 9], 'no': [10, 11, 12]}
df = pd.DataFrame(data)

# Use regex filter to select columns with 'spike' substring
spike_cols = df.filter(regex='spike').columns.tolist()

# Print the column names with the matching substring
print(spike_cols)</code>

Dieser Code iteriert über die Die Spalten von DataFrame nutzen das Listenverständnis und wenden den Regex-Filter an, um nach Spalten mit der Teilzeichenfolge „Spike“ zu suchen. Die resultierende Liste der Spaltennamen wird dann in der Variable „spike_cols“ gespeichert, die verwendet werden kann, um bei Bedarf auf die entsprechenden Spalten zuzugreifen.

Ein anderer Ansatz besteht darin, die Spaltennamen in eine Liste umzuwandeln und darüber zu iterieren und jede einzelne zu testen Name für eine Teilzeichenfolge-Übereinstimmung mithilfe einer for-Schleife und einer if-Anweisung:

<code class="python"># Column names converted to a list
col_list = list(df.columns)

# Iterate over the column names
for col in col_list:
    if 'spike' in col:
        # Column name with matching substring found
        print(col)</code>

Mit diesen Methoden können Sie effizient Spalten in einem DataFrame identifizieren und darauf zugreifen, deren Namen eine bestimmte Zeichenfolge enthalten, auch wenn es sich nicht um eine handelt exakte Übereinstimmung.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Spalten mit teilweisen Zeichenfolgenübereinstimmungen in einem DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn