Heim  >  Artikel  >  Backend-Entwicklung  >  Wie entferne ich unerwünschte Zeichen aus Zeichenfolgen in einer Pandas DataFrame-Spalte?

Wie entferne ich unerwünschte Zeichen aus Zeichenfolgen in einer Pandas DataFrame-Spalte?

Susan Sarandon
Susan SarandonOriginal
2024-11-08 09:17:02690Durchsuche

How to Remove Unwanted Characters from Strings in a Pandas DataFrame Column?

Unerwünschte Zeichen aus Zeichenfolgen in einer Datenspalte entfernen

In dieser Programmierfrage besteht die Aufgabe darin, unerwünschte Zeichen effizient aus Zeichenfolgen in einer Datenspalte zu entfernen bestimmte Spalte eines Pandas DataFrame. Die Daten enthalten eine „Ergebnis“-Spalte mit Zeichenfolgen, denen Vorzeichen und Buchstaben vorangestellt sind. Das Ziel besteht darin, diese Zeichenfolgen zu kürzen, um nur die gewünschten numerischen Werte beizubehalten.

Lösungsversuche mit „.str.lstrip(' -')“ und „.str.rstrip('aAbBcC')“ führten zu Fehlern aufgrund der Übergabe falscher Argumente.

Um dieses Problem zu beheben, nutzt die Lösung die Funktion „.map()“, um eine Lambda-Funktion auf jedes Element in der Spalte „Ergebnis“ anzuwenden. Hier ist der Code:

data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))

Dieser Code entfernt die unerwünschten Zeichen aus jeder Zeichenfolge in der Spalte „Ergebnis“ und weist die geänderten Werte wieder der Spalte zu.

Erklärung:

  • Die Funktion „.map()“ iteriert über jedes Element in der Spalte „Ergebnis“ und wendet die angegebene Lambda-Funktion auf jedes Element an.
  • Die Lambda-Funktion „x ' akzeptiert ein einzelnes Argument (eine Zeichenfolge) und entfernt die führenden Zeichen ' ' oder '-' mit '.lstrip(' -')'.
  • Anschließend werden die nachgestellten Zeichen 'a', 'A' entfernt. , 'b', 'B' oder 'c' Zeichen unter Verwendung von '.rstrip('aAbBcC')'.
  • Der geänderte Wert, der jetzt eine gekürzte numerische Zeichenfolge ist, wird dem Ergebnis wieder zugewiesen '-Spalte, wodurch die ursprüngliche Zeichenfolge effektiv ersetzt wird.

Durch die Verwendung der Funktion „.map()“ und des Lambda-Ausdrucks entfernt dieser Code effizient die unerwünschten Zeichen aus den Zeichenfolgen in der DataFrame-Spalte und stellt so dies sicher Die gewünschten Zahlenwerte bleiben erhalten.

Das obige ist der detaillierte Inhalt vonWie entferne ich unerwünschte Zeichen aus Zeichenfolgen in einer Pandas DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn