Python 中文編碼
前面章節中我們已經學會如何用Python 輸出"Hello, World!",英文沒有問題,但是如果你輸出中文字元"你好,世界"就有可能會碰到中文編碼問題。
Python 檔案中如果未指定編碼,在執行程序會出現報錯:
#!/usr/bin/python
print "你好,世界";
print "你好,世界";
以上程式執行輸出結果為:
File "test.py", line 2
SyntaxError: Non-ASCII character '\xe4' in file testtest. py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
SyntaxError: Non-ASCII character '\xe4' in file testtest. py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
#Python中預設編碼的格式是ASCII 格式,在ASCII 中預設編碼的格式是在ASCII中預設編碼沒修改編碼格式時無法正確列印漢字,所以讀取中文時會報錯。
解決方法為只要在檔案開頭加入 # -*- coding: UTF-8 -*- 或 #coding=utf-8 就行了。
輸出結果為:
你好,世界
所以如果大家再學習過程中,程式碼包含中文,就需要在頭部指定編碼。
注意:Python3.X 原始碼檔案預設使用utf-8編碼,所以可以正常解析中文,無需指定 UTF-8 編碼。
注意:如果你使用編輯器,同時需要設定好編輯器的編碼,如Pycharm 設定步驟:
進入file > Settings,在輸入框中搜尋encoding。
找到 Editor > File encodings,將 IDE Encoding 和 Project Encoding 設定為utf-8。