将 Pandas 包含缺失值的列转换为整数 Dtype
在 Pandas 中,将包含缺失值 (NaN) 的列转换为整数通常会导致错误。这是因为默认情况下整数类型无法保存缺失的信息。不过,Pandas 现在通过可为空整数数据类型提供了解决方案。
可空整数 Dtype
在 0.24 版本中。 在 Pandas 中,您可以使用可为 null 的整数数据类型来表示可能存在缺失值的整数值。此数据类型实现为 arrays.IntegerArray,并且在创建数组或系列时需要显式指定:
arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) pd.Series(arr) 0 1 1 2 2 NaN dtype: Int64
将列转换为可空整数
将列转换为可为空的整数数据类型,请使用以下语法:
df['myCol'] = df['myCol'].astype('Int64')
通过指定 Int64 数据类型,您明确通知 Pandas 该列应该具有能够容纳缺失值 (NaN) 的整数数据类型。这种方法允许您表示缺少信息的整数值,而不会遇到类型转换错误。
以上是如何将具有 NaN 值的 Pandas 列转换为整数数据类型?的详细内容。更多信息请关注PHP中文网其他相关文章!