首页 >后端开发 >Python教程 >如何替换 Pandas DataFrame 列中的 NaN 值?

如何替换 Pandas DataFrame 列中的 NaN 值?

Barbara Streisand
Barbara Streisand原创
2024-12-09 11:24:06630浏览

How to Replace NaN Values in a Pandas DataFrame Column?

替换 DataFrame 列中的 NaN 值

使用 pandas DataFrame 时,经常会遇到表示为 NaN(非数字)的缺失值。处理这些值对于确保准确的数据分析和防止错误至关重要。本文提供了有关如何替换 DataFrame 列中的 NaN 值的综合指南。

背景

以下 DataFrame 包含一个名为“Amount”的列,其中包含一些 NaN 值:

       Date                  Amount
67    2012-09-30 00:00:00   65211
68    2012-09-09 00:00:00   29424
69    2012-09-16 00:00:00   29877
70    2012-09-23 00:00:00   30990
71    2012-09-30 00:00:00   61303
72    2012-09-09 00:00:00   71781
73    2012-09-16 00:00:00     NaN
74    2012-09-23 00:00:00   11072
75    2012-09-30 00:00:00  113702
76    2012-09-09 00:00:00   64731
77    2012-09-16 00:00:00     NaN

使用 DataFrame.fillna() 或 Series.fillna()

最直接的替换方法NaN 值使用 fillna() 方法。它允许您指定一个值或函数来填充缺失的数据:

df['Amount'] = df['Amount'].fillna(0)

这会将“金额”列中的所有 NaN 值替换为 0。

用 填充 NaN 值特定值

要用特定值填充 NaN 值,请使用:

df['Amount'].fillna({NaN: 100})

This会将 NaN 值替换为 100。

根据其他列填充 NaN 值

您还可以根据其他列中的值填充 NaN 值:

df['Amount'].fillna(df['Amount'].mean())

这将用“金额”列的平均值填充 NaN 值。

以上是如何替换 Pandas DataFrame 列中的 NaN 值?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn