首頁 >後端開發 >Python教學 >在 Python 中讀取文字檔案時如何修復「UnicodeDecodeError」?

在 Python 中讀取文字檔案時如何修復「UnicodeDecodeError」?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-12-13 00:18:22525瀏覽

How to Fix a 'UnicodeDecodeError' When Reading Text Files in Python?

解決「UnicodeDecodeError」和編碼轉換

在嘗試操作儲存在文字檔案中的資料時,遇到以下錯誤:

Traceback (most recent call last):  
File "SCRIPT LOCATION", line NUMBER, in <module>  
    text = file.read()
File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode  
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x90 in position 2907500: character maps to `<undefined>`  

此錯誤源自於假定的編碼(CP1252)與文件的實際編碼之間的不符。要解決此問題,我們需要識別正確的編碼並在開啟檔案時明確指定它。

識別文件編碼

如問題中所述,確定文件的編碼至關重要。不幸的是,這需要手動完成。常見的編碼包括 Latin-1 和 UTF-8。但是,鑑於 0x90 在 Latin-1 中不是有效字符,UTF-8 是一個強有力的候選字符。

指定編碼

確定編碼後,您可以在開啟檔案時使用編碼參數指定:

file = open(filename, encoding="utf8")

透過提供正確的編碼, Python 將能夠正確解碼文字檔案並允許您操作其內容而不會遇到「UnicodeDecodeError」異常。

以上是在 Python 中讀取文字檔案時如何修復「UnicodeDecodeError」?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn