ファイル書き込み用の Unicode テキストのデコード
Unicode テキストをファイルに書き込むときにエンコードの問題が発生しました。これを克服するには、できる限り Unicode オブジェクトを扱うことが重要です。
Unicode 文字列のエンコード
文字列が Unicode オブジェクト (接頭辞 " で示される) の場合Python では u")、ファイルに書き込む前に Unicode でエンコードされた文字列に変換する必要があります。次の形式を使用します:
foo = u'Δ, Й, ק, م, ๗, あ, 叶, 葉, and 말.' f = open('test', 'w') f.write(foo.encode('utf8')) # Encode to UTF-8 f.close()
これにより、非 ASCII 文字がファイル内で適切にエンコードされます。
読み取り中のデコード
の場合エンコードされたファイルから読み取ると、Unicode でエンコードされた文字列が取得されます。 Unicode オブジェクトを取得するには、それをデコードします。
f = file('test', 'r') print f.read().decode('utf8') # Decode from UTF-8
次の手順に従うことで、ファイルへの書き込みおよびファイルからの読み取り中に Unicode テキストを安全に処理でき、特殊文字と記号が確実に保持されます。
以上がPython で Unicode テキスト ファイルを読み書きする方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。