sys.getdefaultencoding()是設定預設的string的編碼格式,如果你在python中進行編碼和解碼的時候,不指定編碼方式,那麼python就會使用defaultencoding。
而python2.x的的defaultencoding是ascii,這也就是大多數python編碼報錯:「UnicodeDecodeError: 'ascii' codec can't decode byte ......」的原因。
與此有類似功能的# coding:utf-8 作用是定義原始碼的編碼. 如果沒有定義, 此原始碼中是不可以包含中文字串的.
注意:python2.7以後setdefaultencoding就廢棄掉了,所以在python3.x中不可使用
程式碼實例:
#!/usr/bin/env python #encoding: utf-8 import sys #引用sys模块进来,并不是进行sys的第一次加载 reload(sys) #重新加载sys sys.setdefaultencoding('utf8') ##调用setdefaultencoding函数
可以正確的執行,可是下面的程式碼會出錯時必須要先reload一次sys模組,因為這裡的import語句其實不是sys的第一次導入語句,也就是說這裡其實可能是第二、三次進行sys模組的import,這裡只是一個對sys的引用,只能reload才能進行重新載入。
那麼為什麼要重新加載,而直接引用過來則不能調用該函數呢?因為setdefaultencoding函數在被系統呼叫後被刪除了,所以透過import引用進來時其實已經沒有了,所以必須reload一次sys模組,這樣setdefaultencoding才會為可用,才能在程式碼裡修改解釋器目前的字元編碼。