對Pandas CSV 解析的「pandas.parser.CParserError:錯誤標記資料」進行故障排除
人們可能會遇到「pandas .parser.CParserError」 :使用時標記資料錯誤時發生錯誤Pandas 函式庫的pd.read_csv函數,表示 CSV 檔案的給定行中預期的字段數與遇到的字段數之間存在差異。
錯誤訊息表示庫預期特定行中存在兩個欄位 (在本例中為第 3 行),但遇到的是第 12 行。這種差異可能是由於資料格式錯誤造成的,例如欄位中缺少值或多餘逗號。
要解決此問題並繼續CSV 解析,請考慮以下方法:
利用on_bad_lines 參數:
data = pd.read_csv(path, on_bad_lines='skip')
要對無效行進行更高階的處理,請實作一個自訂可呼叫函數定義偵測到壞行時要採取的操作。
如果您的 Pandas 版本低於 1.3.0,您可以替換 on_bad_lines帶有 error_bad_lines 的參數:
data = pd.read_csv("file1.csv", error_bad_lines=False)
作為Pandas 的替代方案,您可以探索使用Python 中的CSV模組,它提供了用於解析的基本實用程式CSV 檔案。然而,它可能無法提供與 Pandas 相同程度的靈活性和功能。
以上是如何解決讀取 CSV 檔案時 Pandas `pandas.parser.CParserError: Error tokenizing data` 錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!