Heim >Backend-Entwicklung >Python-Tutorial >Wie fülle ich fehlende Werte in Pandas-DataFrames mithilfe von Gruppenmitteln aus?

Wie fülle ich fehlende Werte in Pandas-DataFrames mithilfe von Gruppenmitteln aus?

Barbara Streisand
Barbara StreisandOriginal
2024-12-07 01:09:12978Durchsuche

How to Fill Missing Values in Pandas DataFrames using Group Means?

Fehlende Werte in Gruppen mit Mittelwert füllen

Sie erhalten einen Pandas-DataFrame mit fehlenden Werten und möchten diese Werte mit dem füllen Mittelwert jeder Gruppe, die durch eine bestimmte Spalte definiert ist. Diese häufige Aufgabe kann mit verschiedenen Methoden gelöst werden.

Verwendung von GroupBy und Transformation

Ein effektiver Ansatz besteht darin, die Funktionen groupby() und transform() zu verwenden:

grouped = df.groupby('name')
df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))

In diesem Code gruppieren wir zunächst den DataFrame nach der Spalte „Name“ mithilfe von groupby(). Dann wenden wir eine Lambda-Funktion mit transform() auf die Spalte „Wert“ an. Diese Funktion untersucht jede Gruppe und ergänzt fehlende Werte mit dem Mittelwert dieser Gruppe. Das Endergebnis wird wieder in der ursprünglichen Spalte „Wert“ gespeichert.

Mit dieser Technik können Sie fehlende Werte effizient behandeln, indem Sie sie durch aussagekräftige Werte ersetzen, die aus den Daten jeder Gruppe abgeleitet werden.

Das obige ist der detaillierte Inhalt vonWie fülle ich fehlende Werte in Pandas-DataFrames mithilfe von Gruppenmitteln aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn