使用 pd.read_csv('somefile.csv') 使用 Pandas 加载 CSV 文件时,您可能会遇到警告:
DtypeWarning: Columns (4,5,7,16) have mixed types. Specify dtype option on import or set low_memory=False.
low_memory 选项已过时,没有功能影响。其目的是通过防止类型推断来减少文件解析期间的内存使用。然而,它现在没有什么不同。
出现警告是因为猜测每列的数据类型是资源密集型的。 Pandas 通过分析整个文件来确定数据类型。如果没有显式定义数据类型,则在读取完整文件之前无法开始解析。
指定数据类型(例如 dtype={'user_id': int})通知 Pandas关于预期的数据类型,使其能够立即开始解析。
pd.read_csv('somefile.csv', dtype={'user_id': int})
定义数据类型可以避免遇到无效数据类型(例如整数列中的“foobar”)时出现错误。
Pandas 支持各种数据类型,包括:
Pandas 特定:
以上是如何处理 Pandas 的 Dtype 警告:Low_Memory 和 Dtype 选项?的详细内容。更多信息请关注PHP中文网其他相关文章!