Heim >Backend-Entwicklung >Python-Tutorial >Wie ersetze ich NaN-Werte in einer Pandas DataFrame-Spalte?
Bei der Arbeit mit Pandas-DataFrames kommt es häufig vor, dass fehlende Werte auftreten, die als NaN (Not a Number) dargestellt werden. Der Umgang mit diesen Werten ist entscheidend, um eine genaue Datenanalyse sicherzustellen und Fehler zu vermeiden. Dieser Artikel bietet eine umfassende Anleitung zum Ersetzen von NaN-Werten in einer DataFrame-Spalte.
Der folgende DataFrame enthält eine Spalte mit dem Namen „Amount“ mit einigen NaN-Werten:
Date Amount 67 2012-09-30 00:00:00 65211 68 2012-09-09 00:00:00 29424 69 2012-09-16 00:00:00 29877 70 2012-09-23 00:00:00 30990 71 2012-09-30 00:00:00 61303 72 2012-09-09 00:00:00 71781 73 2012-09-16 00:00:00 NaN 74 2012-09-23 00:00:00 11072 75 2012-09-30 00:00:00 113702 76 2012-09-09 00:00:00 64731 77 2012-09-16 00:00:00 NaN
Die einfachste Methode zum Ersetzen von NaN-Werten ist die Verwendung von fillna()-Methode. Sie können einen Wert oder eine Funktion angeben, um die fehlenden Daten zu füllen:
df['Amount'] = df['Amount'].fillna(0)
Dadurch werden alle NaN-Werte in der Spalte „Betrag“ durch 0 ersetzt.
Um NaN-Werte mit spezifischen Werten zu füllen, verwenden Sie:
df['Amount'].fillna({NaN: 100})
Dadurch werden NaN-Werte durch ersetzt 100.
Sie können NaN-Werte auch basierend auf Werten in anderen Spalten füllen:
df['Amount'].fillna(df['Amount'].mean())
Dadurch werden NaN-Werte mit gefüllt Mittelwert der Spalte „Betrag“.
Das obige ist der detaillierte Inhalt vonWie ersetze ich NaN-Werte in einer Pandas DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!