首頁  >  文章  >  後端開發  >  為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?

為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?

Patricia Arquette
Patricia Arquette原創
2024-11-04 13:35:01995瀏覽

Why am I getting a UnicodeDecodeError: 'utf-8' codec can't decode byte when iterating through a text file?

「for line in...」導致UnicodeDecodeError: 'utf-8' 編解碼器無法解碼位元組

嘗試時使用「for line in open('filename')」語法迭代文字檔案的行時,程式設計師可能會遇到UnicodeDecodeError,指示「utf-8」編解碼器無法解碼特定位元組。當文字檔案的編碼與「utf-8」編解碼器假定的編碼不符時,通常會發生此錯誤。

解決問題

解決此問題錯誤,開啟文字檔案時需要指定正確的編碼。這可以透過在 open() 函數中加入「encoding=」參數來實現,如下所示:

<code class="python">for line in open('filename', encoding='utf-8'):
    # Read each line</code>

在某些情況下,指定的編碼可能不正確,導致相同的錯誤。為了確定適當的編碼,程式設計師可以檢查文字檔案並識別所使用的字元集。

例如,提問者提供的程式碼片段:

<code class="python">for line in open('u.item'):
    # Read each line</code>

無法解碼文字文件,因為編碼被錯誤地假定為「utf-8」。透過檢查文字文件,發現正確的編碼是「ISO-8859-1」。修改程式碼如下解決了問題:

<code class="python">for line in open('u.item', encoding='ISO-8859-1'):
    # Read each line</code>

以上是為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn