Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich NaN-Werte in Pandas DataFrames effektiv ersetzen?

Wie kann ich NaN-Werte in Pandas DataFrames effektiv ersetzen?

Susan Sarandon
Susan SarandonOriginal
2024-12-03 20:16:10336Durchsuche

How can I effectively replace NaN values in Pandas DataFrames?

NaN-Werte in Dataframe-Spalten ersetzen

Bei der Arbeit mit DataFrames in Pandas können fehlende oder ungültige Daten durch NaN-Werte dargestellt werden. Um die Datenqualität sicherzustellen und Fehler zu vermeiden, ist es häufig erforderlich, diese NaN-Werte durch geeignete Platzhalter oder Imputationen zu ersetzen.

DataFrame.fillna()-Methode

Die einfachste Die Methode zum Ersetzen von NaN-Werten verwendet die Methode fillna(). Es nimmt einen Wert oder ein Wörterbuch als Argument und ersetzt alle NaN-Werte in den angegebenen Spalten oder im gesamten DataFrame durch den bereitgestellten Wert.

Beispiel:

import pandas as pd

df = pd.DataFrame({
    "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489],
    "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", 
             "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"],
    "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")]
})

df.fillna(0)

Ausgabe:

       itm       Date    Amount
0     420  2012-09-30    65211
1     421  2012-09-09    29424
2     421  2012-09-16    29877
3     421  2012-09-23    30990
4     421  2012-09-30    61303
5     485  2012-09-09    71781
6     485  2012-09-16      0.0
7     485  2012-09-23   11072.0
8     485  2012-09-30  113702.0
9     489  2012-09-09    64731
10    489  2012-09-16      0.0

Zusätzlich Methoden:

Während fillna() am häufigsten vorkommt, gibt es mehrere andere Methoden, die zum Ersetzen von NaN-Werten verwendet werden können:

  • .replace() : Mit dieser Methode können NaN-Werte durch einen bestimmten Wert oder einen ersetzt werden mask.
  • .interpolate(): Diese Methode verwendet eine Vielzahl von Interpolationstechniken, um fehlende Werte zu schätzen.
  • .pivot_table(): Dies Die Methode kann zum Gruppieren und Aggregieren von Daten verwendet werden, wobei fehlende Daten ignoriert werden Werte.

Fazit:

Das Ersetzen von NaN-Werten in DataFrames ist für die Datenbereinigung und -manipulation unerlässlich. Durch den Einsatz der oben beschriebenen Methoden können Sie effektiv mit fehlenden oder ungültigen Daten umgehen und so die Integrität und Qualität Ihrer Datenanalyse sicherstellen.

Das obige ist der detaillierte Inhalt vonWie kann ich NaN-Werte in Pandas DataFrames effektiv ersetzen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn