使用 pandas DataFrame 时,经常会遇到表示为 NaN(非数字)的缺失值。处理这些值对于确保准确的数据分析和防止错误至关重要。本文提供了有关如何替换 DataFrame 列中的 NaN 值的综合指南。
以下 DataFrame 包含一个名为“Amount”的列,其中包含一些 NaN 值:
Date Amount 67 2012-09-30 00:00:00 65211 68 2012-09-09 00:00:00 29424 69 2012-09-16 00:00:00 29877 70 2012-09-23 00:00:00 30990 71 2012-09-30 00:00:00 61303 72 2012-09-09 00:00:00 71781 73 2012-09-16 00:00:00 NaN 74 2012-09-23 00:00:00 11072 75 2012-09-30 00:00:00 113702 76 2012-09-09 00:00:00 64731 77 2012-09-16 00:00:00 NaN
最直接的替换方法NaN 值使用 fillna() 方法。它允许您指定一个值或函数来填充缺失的数据:
df['Amount'] = df['Amount'].fillna(0)
这会将“金额”列中的所有 NaN 值替换为 0。
要用特定值填充 NaN 值,请使用:
df['Amount'].fillna({NaN: 100})
This会将 NaN 值替换为 100。
您还可以根据其他列中的值填充 NaN 值:
df['Amount'].fillna(df['Amount'].mean())
这将用“金额”列的平均值填充 NaN 值。
以上是如何替换 Pandas DataFrame 列中的 NaN 值?的详细内容。更多信息请关注PHP中文网其他相关文章!