ホームページ >バックエンド開発 >Python チュートリアル >Python が「UnicodeDecodeError: 'ascii' codec can't decode byte」をスローする理由とその修正方法

Python が「UnicodeDecodeError: 'ascii' codec can't decode byte」をスローする理由とその修正方法

Linda Hamiltonオリジナル: 2024-12-05 22:26:101044ブラウズ

Why Does Python Throw a

Unicode 処理におけるデコードの問題: 「UnicodeDecodeError: 'ascii' codec can't decode byte」への対処

Python の Unicode 処理、特に「UnicodeDecodeError: 'ascii' コーデックはバイトをデコードできません」例外。この問題は、元の文字列のエンコーディングを指定せずに、非 ASCII 文字を含む Python 2.x str を Unicode 文字列に変換しようとすると発生します。

Unicode 文字列について

Unicode 文字列は通常の Python 文字列とは異なり、さまざまな言語の広範囲の文字を表す Unicode ポイントコードを保持します。一方、文字列には、さまざまな形式 (UTF-8、UTF-16 など) でエンコードされたテキストが含まれます。文字列は Unicode にデコードされ、Unicode 文字列は文字列にエンコードされます。

「Unicode サンドイッチ」パターン

入力/デコード:

u 接頭辞を付けて Unicode 文字列を宣言する(例: u'Zürich')。
非 ASCII 文字のソースコードでエンコーディングヘッダーを使用します (例: #coding: utf-8)。
io モジュールの TextWrapper を使用します。指定されたエンコーディングでファイルをデコードします (例: io.open("file.txt", "r", encode="utf-8") as my_file).

サンドイッチの肉:

通常のように Unicode 文字列を使用しますstrings.

出力:

Python は、印刷時に Unicode 文字列をコンソールのエンコーディングにエンコードしようとします。
io.open Unicode 文字列をバイト文字列にエンコードして書き込むことができますfiles.

Avoid sys.setdefaultencoding('utf8')

このハックは Unicode の問題をマスクするだけであり、デフォルトのエンコーディングが使用される Python 3.0 への移行を妨げる可能性があります。は UTF-8 です。

Python 3考慮事項

Python 3 のデフォルトのエンコーディングは UTF-8 です。
str 型は Unicode 文字列になりましたが、古い str 型はバイトになりました。
open() はデフォルトでテキストモードで動作し、デコードされた Unicode 文字列を返します。

以上がPython が「UnicodeDecodeError: 'ascii' codec can't decode byte」をスローする理由とその修正方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Python throw ASCII

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：「executable_path」の Selenium Python DeprecationWarning を修正するにはどうすればよいですか?次の記事：「executable_path」の Selenium Python DeprecationWarning を修正するにはどうすればよいですか?

続きを見る