Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich einen teilweisen String-Abgleich in Pandas-DataFrames effizient durchführen?

Wie kann ich einen teilweisen String-Abgleich in Pandas-DataFrames effizient durchführen?

Patricia Arquette
Patricia ArquetteOriginal
2024-12-16 15:15:15928Durchsuche

How Can I Efficiently Perform Partial String Matching in Pandas DataFrames?

Partielle String-Übereinstimmung in Pandas DataFrames

Das Filtern eines DataFrames basierend auf String-Kriterien ist eine häufige Aufgabe bei der Datenanalyse. Während exakte Zeichenfolgenübereinstimmungen mit dem ==-Operator unkompliziert sind, erfordern teilweise Zeichenfolgenübereinstimmungen einen anderen Ansatz.

Eine Möglichkeit ist die Verwendung regulärer Ausdrücke, wie durch den Codeausschnitt in der Frage gezeigt:

re.search(pattern, cell_in_question)

Für große DataFrames kann dieser Ansatz jedoch aufgrund seiner iterativen Natur ineffizient sein.

Eine vektorisierte Lösung mit den Series.str-Methoden von Pandas ist verfügbar und für eine bessere Leistung dringend empfohlen:

df[df['A'].str.contains("hello")]

Diese Methode verwendet die integrierte Funktion enthält(), um zu prüfen, ob ein Teilstring in einer Reihe von Strings vorhanden ist. Es gibt eine boolesche Maske zurück, die zum Filtern des DataFrame verwendet werden kann.

In früheren Versionen von Pandas (vor 0.8.1) wurde eine etwas andere Syntax verwendet:

df['A'].apply(lambda x: "hello" in x)

Unabhängig davon Je nachdem, welchen Ansatz Sie wählen, ist der teilweise String-Abgleich in Pandas DataFrames ein leistungsstarkes Tool zum effizienten und effektiven Filtern von Daten.

Das obige ist der detaillierte Inhalt vonWie kann ich einen teilweisen String-Abgleich in Pandas-DataFrames effizient durchführen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn