urlencode 調用方法
urlencode的參數必須是Dictionary
import urllib d = {'name1':'www.pythontab.com','name2':'bbs.pythontab.com'} print urllib.urlencode(d)
輸出:
name2=bbs.pythontab.com&name1=www.pythontab.com
相當於拼接兩個url參數,這個用法類似於PHP中的http_build_query(),這裡就不多數PHP怎麼用了,有興趣的自己去查一下。
urlencode 編碼
函數urlencode不會改變傳入參數的原始編碼,也就是說需要在呼叫之前將post或get參數的編碼調整好。
問題:現在模擬請求Google和baidu,由於baidu使用的是gb2312編碼,google使用的是utf8編碼,兩個站點提交到URL中的中文參數的urlencode值是不一樣,下面以”PythonTab中文網”為例:
# coding: UTF-8 str = u'PythonTab中文网' str = str.encode('gb2312') d = {'name':str} q = urllib.urlencode(d) print q
結果:
name=PythonTab%D6%D0%CE%C4%CD%F8
得到漢字的GBK編碼
urllib 轉換字串
其實可以用urllib的quote函數對URL中的中文進行轉換,將中文轉換成GBK的編碼,得到的編碼是符合URI標準的URL。
from django.utils.http import urlquote a = urlquote('PythonTab中文网') print a