Heim >Backend-Entwicklung >Python-Tutorial >Wie kann man Leerzeichenwerte in Pandas-DataFrames effizient durch NaN ersetzen?

Wie kann man Leerzeichenwerte in Pandas-DataFrames effizient durch NaN ersetzen?

Mary-Kate OlsenOriginal: 2024-10-27 05:03:30425Durchsuche

How to Efficiently Replace Whitespace Values with NaN in Pandas DataFrames?

Ersetzen von Leerwerten (Leerzeichen) durch NaN in Pandas

Problem:

Betrachten Sie einen Pandas-Datenrahmen mit Leerzeichenwerten in bestimmten Spalten vorhanden. Das Ziel besteht darin, diese Leerzeichen durch NaN-Werte zu ersetzen.

Hässliche Lösung:

<code class="python">for i in df.columns:
    df[i][df[i].apply(lambda i: True if re.search('^\s*$', str(i)) else False)]=None</code>

Diese Lösung iteriert durch jede Spalte, generiert eine boolesche Maske mit Regex, und ersetzt Leerraumwerte durch None. Es ist jedoch ineffizient und nicht idiomatisch.

Verbesserte Lösung:

<code class="python">df = pd.DataFrame([
    [-0.532681, 'foo', 0],
    [1.490752, 'bar', 1],
    [-1.387326, 'foo', 2],
    [0.814772, 'baz', ' '],
    [-0.222552, '   ', 4],
    [-1.176781, 'qux', '  '],
], columns='A B C'.split(), index=pd.date_range('2000-01-01','2000-01-06'))

# replaces field that's entirely space (or empty) with NaN
print(df.replace(r'^\s*$', np.nan, regex=True))</code>

Diese Lösung nutzt die integrierte Funktion replace() von Pandas, die dies kann kann verwendet werden, um bestimmte Werte basierend auf einem Regex-Muster zu ersetzen. Durch die Verwendung von r'^s*$' gleicht der reguläre Ausdruck jedes Feld ab, das vollständig aus Leerzeichen besteht (oder leer ist), und ersetzt es durch NaN.

Optimierungen:

Überprüfen Sie, ob der Spaltendatentyp ein Objekt ist, da Leerzeichenwerte normalerweise in Objektspalten gefunden werden.
Verwenden Sie r'^s $' anstelle von r'^s*$', wenn gültige Daten Leerzeichen enthalten .

Das obige ist der detaillierte Inhalt vonWie kann man Leerzeichenwerte in Pandas-DataFrames effizient durch NaN ersetzen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

pandas Boolean Object if using Regex function this column

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Hier sind ein paar Titel, die zu Ihrem Artikel passen, mit Fragen, die die wichtigsten Erkenntnisse hervorheben: * Pythons „eval()“: Rechnerkomfort oder Sicherheitsalbtraum? * Jenseits von Sandboxing: Sichere AlternativenNächster Artikel：Hier sind ein paar Titel, die zu Ihrem Artikel passen, mit Fragen, die die wichtigsten Erkenntnisse hervorheben: * Pythons „eval()“: Rechnerkomfort oder Sicherheitsalbtraum? * Jenseits von Sandboxing: Sichere Alternativen

In Verbindung stehende Artikel

Mehr sehen