首页 >后端开发 >Python教程 >如何使用组均值填充 Pandas DataFrame 中的缺失值?

如何使用组均值填充 Pandas DataFrame 中的缺失值?

Barbara Streisand
Barbara Streisand原创
2024-12-07 01:09:12978浏览

How to Fill Missing Values in Pandas DataFrames using Group Means?

用平均值填充组中的缺失值

给你一个包含缺失值的 pandas DataFrame,你的目标是用由特定列定义的每个组的平均值。这个常见任务可以使用多种方法来解决。

使用 GroupBy 和 Transformation

有效的方法包括使用 groupby() 和 transform() 函数:

grouped = df.groupby('name')
df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))

在此代码中,我们首先使用 groupby() 按“name”列对 DataFrame 进行分组。然后,我们使用 Transform() 在“值”列上应用 lambda 函数。此函数检查每个组并用该组的平均值填充缺失值。最终结果存储回原始“值”列中。

通过采用此技术,您可以通过使用从每个组的数据派生的有意义的值替换缺失值来有效地处理缺失值。

以上是如何使用组均值填充 Pandas DataFrame 中的缺失值?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn