ホームページ >バックエンド開発 >Python チュートリアル >Python コーディングの問題に対処するために Python を学習する
まとめると、python1.6からはunicode文字も処理できるようになりました。
1. いくつかの一般的なエンコード形式。
1.1、ASCII、1 バイトで表されます。
1.2. UTF-8 は 1 ~ 3 バイトで表されます。ASCII エンコードは UTF-8 のサブセットです。
1.3、UTF-16。Python では、Unicode の意味は UTF-16 です。
2. Python ソースファイルのエンコードとデコード 作成した Python プログラムの生成から実行までのプロセスは次のとおりです。
エディタ----> ソースコード--- -> ;インタプリタ---->出力結果
2.1. エディタはソースコードのエンコード形式を決定します(エディタで設定)
2.2. インタプリタはソースコードのエンコード形式も知っている必要があります(残念ながら、エンコードされたデータからソースファイルのエンコード形式を知ることは困難です)
2.3. 補足: Windows で UltraEdit を使用してソースコードを UTF-8 として保存すると、BOM マークが記録されます。ただし、Eclipse を使用してソース ファイルを編集すると、エディターではファイル エンコーディングが UTF- として指定されていますが、ActivePython インタープリターはソース ファイルが UTF-8 形式であることを自動的に認識します。 8 では、BOM マークが記録されていないため、ソース ファイルの先頭に BOM マークを記録する必要があります。 #coding=utf-8 を追加すると、コメントを使用してソース ファイルのエンコード方法についてインタプリタに指示することができます。
2.4. 例: たとえば、「私は中国人です」を端末に出力したいとします。