Heim >Backend-Entwicklung >Python-Tutorial >Wie fülle ich fehlende Werte in Pandas-DataFrames mithilfe von Gruppenmitteln aus?
Fehlende Werte in Gruppen mit Mittelwert füllen
Sie erhalten einen Pandas-DataFrame mit fehlenden Werten und möchten diese Werte mit dem füllen Mittelwert jeder Gruppe, die durch eine bestimmte Spalte definiert ist. Diese häufige Aufgabe kann mit verschiedenen Methoden gelöst werden.
Verwendung von GroupBy und Transformation
Ein effektiver Ansatz besteht darin, die Funktionen groupby() und transform() zu verwenden:
grouped = df.groupby('name') df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))
In diesem Code gruppieren wir zunächst den DataFrame nach der Spalte „Name“ mithilfe von groupby(). Dann wenden wir eine Lambda-Funktion mit transform() auf die Spalte „Wert“ an. Diese Funktion untersucht jede Gruppe und ergänzt fehlende Werte mit dem Mittelwert dieser Gruppe. Das Endergebnis wird wieder in der ursprünglichen Spalte „Wert“ gespeichert.
Mit dieser Technik können Sie fehlende Werte effizient behandeln, indem Sie sie durch aussagekräftige Werte ersetzen, die aus den Daten jeder Gruppe abgeleitet werden.
Das obige ist der detaillierte Inhalt vonWie fülle ich fehlende Werte in Pandas-DataFrames mithilfe von Gruppenmitteln aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!