在嘗試操作儲存在文字檔案中的資料時,遇到以下錯誤:
Traceback (most recent call last): File "SCRIPT LOCATION", line NUMBER, in <module> text = file.read() File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode return codecs.charmap_decode(input,self.errors,decoding_table)[0] UnicodeDecodeError: 'charmap' codec can't decode byte 0x90 in position 2907500: character maps to `<undefined>`
此錯誤源自於假定的編碼(CP1252)與文件的實際編碼之間的不符。要解決此問題,我們需要識別正確的編碼並在開啟檔案時明確指定它。
識別文件編碼
如問題中所述,確定文件的編碼至關重要。不幸的是,這需要手動完成。常見的編碼包括 Latin-1 和 UTF-8。但是,鑑於 0x90 在 Latin-1 中不是有效字符,UTF-8 是一個強有力的候選字符。
指定編碼
確定編碼後,您可以在開啟檔案時使用編碼參數指定:
file = open(filename, encoding="utf8")
透過提供正確的編碼, Python 將能夠正確解碼文字檔案並允許您操作其內容而不會遇到「UnicodeDecodeError」異常。
以上是在 Python 中讀取文字檔案時如何修復「UnicodeDecodeError」?的詳細內容。更多資訊請關注PHP中文網其他相關文章!