ホームページ  >  記事  >  バックエンド開発  >  Python でテキスト ファイルに書き込むときに Unicode 文字が正しく表示されるようにするにはどうすればよいですか?

Python でテキスト ファイルに書き込むときに Unicode 文字が正しく表示されるようにするにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-11-01 12:57:29825ブラウズ

How Can I Ensure Correct Display of Unicode Characters When Writing to a Text File in Python?

テキスト ファイルの書き込みでの Unicode 文字の処理

テキスト ファイルに非 ASCII 文字を書き込むには、文字エンコーディングを慎重に検討する必要があります。この質問では、データ処理における Unicode の使用について調査しており、ファイルへの書き込み中にエンコード エラーが発生しました。

部分的な解決策では、問題のあるコーデックを Python の open 関数に置き換えます。この関数は、デフォルトでファイルをバイナリ モードで開きます。これによりデコード エラーは解決しますが、テキスト ファイル内で文字が正しく表示されないという別の問題が発生します。

これを解決するには、プロセス全体で Unicode のみを処理することが重要です。取得時にデータを Unicode オブジェクトに変換し、必要な場合にのみエンコードすることで、適切な文字表現が保証されます。

次の変更された Python コードは、このアプローチの例です。

<code class="python">import unicodedata

row = [unicodedata.normalize('NFC', x.strip()) if x is not None else u'' for x in row]
all_html = row[0] + "<br/>" + row[1]
with open('out.txt', 'wb') as f:
    f.write(all_html.encode("utf-8"))</code>

Unicode を NFD 形式に正規化することで、テキストはプラットフォーム間で一貫して NFC として表現できるため、テキスト エディターでの正しい表示が保証されます。

以上がPython でテキスト ファイルに書き込むときに Unicode 文字が正しく表示されるようにするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。