Python での Unicode テキスト ファイルの読み取りと書き込み
テキスト ファイル内の Unicode 文字を扱う場合、Python は適切な処理を保証するための複数のアプローチを提供します。 encode() メソッドと decode() メソッドを使用して Unicode 文字列を読み書きしようとすると、一般的な問題が 1 つ発生します。
この課題を克服するには、ファイルを開くときにファイル エンコーディングを指定することをお勧めします。 Python 2.6 での io モジュールの導入により、io.open 関数が利用可能になり、目的のエンコーディングを指定できるようになりました。
<code class="python">import io # Assuming the file is encoded in UTF-8 f = io.open("test", mode="r", encoding="utf-8") unicodeString = f.read()</code>
Python 3.x では、io.open 関数はエイリアスです。組み込みの open 関数の場合、インポートの必要がなくなります。
別のオプションは、コーデック標準ライブラリの open() を使用することです。 module:
<code class="python">import codecs f = codecs.open("test", "r", "utf-8") unicodeString = f.read()</code>
ただし、このアプローチでは、read() 操作と readline() 操作を混合する場合に互換性の問題が発生する可能性があります。
Unicode 文字列を UTF-8 エンコーディングでファイルに書き込むには、次のコード スニペットを使用できます:
<code class="python"># assumes unicodeString is a Unicode string outputFile = io.open("output.txt", mode="w", encoding="utf-8") outputFile.write(unicodeString)</code>
これらのガイドラインに従うことで、テキスト ファイルの読み取りおよび書き込み時に Unicode 文字が正しく処理されるようにすることができます。パイソン。
以上がPython で Unicode テキスト ファイルを読み書きする方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。