Heim >Backend-Entwicklung >Python-Tutorial >Wie entferne ich unerwünschte Zeichen effizient aus Zeichenfolgen in einer DataFrame-Spalte?

Wie entferne ich unerwünschte Zeichen effizient aus Zeichenfolgen in einer DataFrame-Spalte?

Patricia Arquette
Patricia ArquetteOriginal
2024-11-06 19:39:02800Durchsuche

How to Efficiently Remove Unwanted Characters from Strings in a DataFrame Column?

Unerwünschte Teile aus Zeichenfolgen in einer DataFrame-Spalte entfernen

Sie haben eine DataFrame-Spalte, die Zeichenfolgen mit unerwünschten Zeichen enthält. Sie möchten diese Zeichen effizient entfernen, um die relevanten Daten zu extrahieren.

Die Lösung besteht darin, die Map-Methode von Python zu verwenden, um eine benutzerdefinierte Funktion auf jede Zeichenfolge in der Spalte anzuwenden:

data['result' ] = data['result'].map(lambda x: x.lstrip(' -').rstrip('aAbBcC'))

Diese Lambda-Funktion benötigt eine Zeichenfolge x als Eingabe und führt zwei Operationen aus:

  • x.lstrip(' -') entfernt alle führenden Zeichen „ “ oder „-“.
  • x.rstrip('aAbBcC') entfernt alle nachgestellten Klein- oder Großbuchstaben „a“, „b“ oder „c“. Zeichen.

Das Ergebnis ist eine geänderte Spalte, in der unerwünschte Zeichen entfernt wurden. Sie können nun auf diese bereinigten Zeichenfolgen als Daten['Ergebnis'] zugreifen.

Das obige ist der detaillierte Inhalt vonWie entferne ich unerwünschte Zeichen effizient aus Zeichenfolgen in einer DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn