使用pd.read_csv('somefile.csv') 使用Pandas 載入CSV 檔案時,您可能會遇到到警告:
DtypeWarning: Columns (4,5,7,16) have mixed types. Specify dtype option on import or set low_memory=False.
low_memory 選項已過時,沒有功能影響。其目的是透過防止類型推斷來減少文件解析期間的記憶體使用。然而,它現在沒有什麼不同。
出現警告是因為猜測每列的資料型別是資源密集的。 Pandas 透過分析整個文件來確定資料類型。如果沒有明確定義資料類型,則在讀取完整文件之前無法開始解析。
指定資料型別(例如 dtype={'user_id': int})通知 Pandas關於預期的資料類型,使其能夠立即開始解析。
pd.read_csv('somefile.csv', dtype={'user_id': int})
定義資料型別可以避免遇到無效資料型別(例如整數列中的「foobar」)時發生錯誤。
Pandas 支援各種資料類型,包括:
Pandas 特定:
以上是如何處理 Pandas 的 Dtype 警告:Low_Memory 和 Dtype 選項?的詳細內容。更多資訊請關注PHP中文網其他相關文章!