首頁 >後端開發 >Python教學 >為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組？

為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組？

Why am I getting a UnicodeDecodeError: 'utf-8' codec can't decode byte when iterating through a text file?

「for line in...」導致UnicodeDecodeError: 'utf-8' 編解碼器無法解碼位元組

嘗試時使用「for line in open('filename')」語法迭代文字檔案的行時，程式設計師可能會遇到UnicodeDecodeError，指示「utf-8」編解碼器無法解碼特定位元組。當文字檔案的編碼與「utf-8」編解碼器假定的編碼不符時，通常會發生此錯誤。

解決問題

解決此問題錯誤，開啟文字檔案時需要指定正確的編碼。這可以透過在 open() 函數中加入「encoding=」參數來實現，如下所示：

<code class="python">for line in open('filename', encoding='utf-8'):
    # Read each line</code>

在某些情況下，指定的編碼可能不正確，導致相同的錯誤。為了確定適當的編碼，程式設計師可以檢查文字檔案並識別所使用的字元集。

例如，提問者提供的程式碼片段：

<code class="python">for line in open('u.item'):
    # Read each line</code>

無法解碼文字文件，因為編碼被錯誤地假定為「utf-8」。透過檢查文字文件，發現正確的編碼是「ISO-8859-1」。修改程式碼如下解決了問題：

<code class="python">for line in open('u.item', encoding='ISO-8859-1'):
    # Read each line</code>

以上是為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

看更多