「for line in...」導致UnicodeDecodeError: 'utf-8' 編解碼器無法解碼位元組
嘗試時使用「for line in open('filename')」語法迭代文字檔案的行時,程式設計師可能會遇到UnicodeDecodeError,指示「utf-8」編解碼器無法解碼特定位元組。當文字檔案的編碼與「utf-8」編解碼器假定的編碼不符時,通常會發生此錯誤。
解決問題
解決此問題錯誤,開啟文字檔案時需要指定正確的編碼。這可以透過在 open() 函數中加入「encoding=」參數來實現,如下所示:
<code class="python">for line in open('filename', encoding='utf-8'): # Read each line</code>
在某些情況下,指定的編碼可能不正確,導致相同的錯誤。為了確定適當的編碼,程式設計師可以檢查文字檔案並識別所使用的字元集。
例如,提問者提供的程式碼片段:
<code class="python">for line in open('u.item'): # Read each line</code>
無法解碼文字文件,因為編碼被錯誤地假定為「utf-8」。透過檢查文字文件,發現正確的編碼是「ISO-8859-1」。修改程式碼如下解決了問題:
<code class="python">for line in open('u.item', encoding='ISO-8859-1'): # Read each line</code>
以上是為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?的詳細內容。更多資訊請關注PHP中文網其他相關文章!