首頁 >後端開發 >Python教學 >如何解決讀取 CSV 檔案時 Pandas `pandas.parser.CParserError: Error tokenizing data` 錯誤?

如何解決讀取 CSV 檔案時 Pandas `pandas.parser.CParserError: Error tokenizing data` 錯誤?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-12-08 22:04:12218瀏覽

How to Solve the Pandas `pandas.parser.CParserError: Error tokenizing data` Error When Reading CSV Files?

對Pandas CSV 解析的「pandas.parser.CParserError:錯誤標記資料」進行故障排除

人們可能會遇到「pandas .parser.CParserError」 :使用時標記資料錯誤時發生錯誤Pandas 函式庫的pd.read_csv函數,表示 CSV 檔案的給定行中預期的字段數與遇到的字段數之間存在差異。

錯誤訊息表示庫預期特定行中存在兩個欄位 (在本例中為第 3 行),但遇到的是第 12 行。這種差異可能是由於資料格式錯誤造成的,例如欄位中缺少值或多餘逗號。

要解決此問題並繼續CSV 解析,請考慮以下方法:

利用on_bad_lines 參數:

data = pd.read_csv(path, on_bad_lines='skip') 

此方法會跳過具有意外欄位的違規行,從而允許繼續讀取過程。

要對無效行進行更高階的處理,請實作一個自訂可呼叫函數定義偵測到壞行時要採取的操作。

如果您的 Pandas 版本低於 1.3.0,您可以替換 on_bad_lines帶有 error_bad_lines 的參數:

data = pd.read_csv("file1.csv", error_bad_lines=False)

此選項也會跳過有問題的行,但不需要自訂可呼叫.

作為Pandas 的替代方案,您可以探索使用Python 中的CSV模組,它提供了用於解析的基本實用程式CSV 檔案。然而,它可能無法提供與 Pandas 相同程度的靈活性和功能。

以上是如何解決讀取 CSV 檔案時 Pandas `pandas.parser.CParserError: Error tokenizing data` 錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn