首頁 >後端開發 >Python教學 >如何使用群組平均值填入 Pandas DataFrame 中的缺失值?

如何使用群組平均值填入 Pandas DataFrame 中的缺失值?

Barbara Streisand
Barbara Streisand原創
2024-12-07 01:09:12978瀏覽

How to Fill Missing Values in Pandas DataFrames using Group Means?

用平均值填充組中的缺失值

給你一個包含缺失值的pandas DataFrame,你的目標是用由特定列定義的每個組別的平均值。這個常見任務可以使用多種方法來解決。

使用GroupBy 和Transformation

有效的方法包括使用groupby() 和transform() 函數:

grouped = df.groupby('name')
df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))

在此程式碼中,我們首先使用groupby() 以「name」欄位對DataFrame 進行分組。然後,我們使用 Transform() 在「值」列上套用 lambda 函數。此函數檢查每個組並用該組的平均值填充缺失值。最終結果儲存回原始“值”列中。

透過採用此技術,您可以透過使用從每個群組的資料派生的有意義的值來取代缺失值來有效地處理缺失值。

以上是如何使用群組平均值填入 Pandas DataFrame 中的缺失值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn