Heim > Artikel > Backend-Entwicklung > Wie extrahiere ich Zahlen aus Strings in Pandas mit str.extract()?
Extrahieren von Zahlen aus Zeichenfolgen in Pandas
Um Zahlen aus Zeichenfolgen innerhalb eines Pandas-Datenrahmens zu extrahieren, sollten Sie die Verwendung der str.extract-Methode in Betracht ziehen. Diese Methode ermöglicht die Verwendung regulärer Ausdrücke, um bestimmte Muster aus den Zeichenfolgenwerten eines Datenrahmens zu extrahieren.
Im bereitgestellten Beispiel enthält der df-Datenrahmen eine Spalte „A“ mit gemischten Datentypen, einschließlich Zeichenfolgen, die Zahlen enthalten. Um nur die Zahlen zu extrahieren, kann eine Regex-Erfassungsgruppe verwendet werden:
<code class="python">df.A.str.extract('(\d+)')</code>
Das reguläre Ausdrucksmuster (d) gibt eine Erfassungsgruppe an, die mit einer oder mehreren Ziffern (d) übereinstimmt. Dadurch werden die Zahlen innerhalb jeder Zeichenfolge isoliert.
Das Ergebnis ist eine neue Datenrahmenspalte, die die extrahierten Zahlen enthält:
A 0 1 1 NaN 2 10 3 100 4 0
Beachten Sie, dass diese Methode nur für ganze Zahlen und nicht für Gleitkommazahlen funktioniert . Für komplexere Muster oder Fälle, in denen die Zahlen durch Nicht-Ziffern getrennt sind, ist möglicherweise eine zusätzliche Syntax für reguläre Ausdrücke erforderlich.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Zahlen aus Strings in Pandas mit str.extract()?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!