ホームページ >バックエンド開発 >Python チュートリアル >Python でファイルを読み取るときに「UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xff...」というメッセージが表示されるのはなぜですか?

Python でファイルを読み取るときに「UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xff...」というメッセージが表示されるのはなぜですか?

Susan Sarandonオリジナル: 2024-11-04 07:34:02608ブラウズ

Why am I getting

「エラー UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0xff をデコードできません: 無効な開始バイト」を解決する方法?

Python でこのエラーが発生するのは、utf-8 エンコーディングを使用してバイト配列データを Unicode 文字列に変換しようとしたときに発生する可能性がありますが、バイトシーケンスは utf-8 ルールに従って無効です。

根本的な原因この場合、Python は読み取り操作中にファイルの内容を utf-8 でエンコードされた文字列として解釈します。ただし、ファイルには、utf-8 の有効な開始バイトではないバイトシーケンス (0xff など) など、utf-8 以外の文字が含まれている可能性があります。

このエラーを解決するには、次の性質を考慮してください。ファイルを開き、次の解決策を適用します:

解決策:

ファイルはバイナリファイルである可能性が高いため、バイナリファイルとして扱う必要があります。以下に示すように、オープンモードとして「rb」を使用するようにファイル読み取りコードを変更します。

<code class="python">with open(path, 'rb') as f:
  contents = f.read()</code>

「rb」を指定すると、ファイルはバイナリモードで開かれ、バイナリモードではなくバイトとして保存されます。それらを utf-8 でエンコードされた文字として解釈します。これにより、Python が無効なバイトシーケンスをデコードしようとすることがなくなり、例外が回避されます。

以上がPython でファイルを読み取るときに「UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xff...」というメッセージが表示されるのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Python

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：Python 2.7でUTF-8 URLエンコード文字列をデコードするにはどうすればよいですか?次の記事：Python 2.7でUTF-8 URLエンコード文字列をデコードするにはどうすればよいですか?

続きを見る