python - 使用Scrapy中的Request的时候，怎么把拿到的内容编码转换为utf-8?

Question

当使用第三方库requests的时候，可以这样转换： {代码...} 问题：使用Scrapy中的Request的时候，怎么把拿到的内容编码转换为utf-8? demo: {代码...}

大家讲道理 · Answer

試著回答你的問題，感覺你對python的編碼理解有點偏離。
1、無論requests還是Request，都是一種http協定的實作包而已。
套件回傳封包的編碼來自HTTP協定所造訪的網站，在http協定的頭部會寫明編碼格式。
譬如下碼:
r=requests.get('http://www.baidu.com')
print r.headers['Content-Type']
輸出：
text/html;charset=UTF-8
這裡表明了應答報文的utf-8格式。
scrapy.Request也是一樣。
2、如果回傳的charset=gbk2312，你可以依照你的程式碼需要，決定是否轉碼成你需要的編碼。
r=requests.get('http://www.baidu.com')
print r.content[:1000].decode('utf-8')
print r.content[:1000].decode(' utf-8').encode('gbk')

PHP中文网 · Answer

就是用decode和encode啊，也不管是不是scrapy的事。

python - 使用Scrapy中的Request的时候，怎么把拿到的内容编码转换为utf-8?

全部回覆(2)我來回復