python - 使用Scrapy中的Request的时候，怎么把拿到的内容编码转换为utf-8?

Question

当使用第三方库requests的时候，可以这样转换： {代码...} 问题：使用Scrapy中的Request的时候，怎么把拿到的内容编码转换为utf-8? demo: {代码...}

大家讲道理 · Answer

试着回答你的问题，感觉你对python的编码理解有点跑偏。
1、无论requests还是Request，都是一种http协议的实现包而已。
包返回报文的编码来源于HTTP协议所访问的网站，在http协议的头部会写明编码格式。
譬如如下代码:
r=requests.get('http://www.baidu.com')
print r.headers['Content-Type']
输出：
text/html;charset=UTF-8
这里表明了应答报文的utf-8格式。
scrapy.Request也是一样。
2、如果返回的charset=gbk2312，你可以根据你的代码需要，确定是否转码成你需要的编码。
r=requests.get('http://www.baidu.com')
print r.content[:1000].decode('utf-8')
print r.content[:1000].decode('utf-8').encode('gbk')

PHP中文网 · Answer

就是用decode和encode啊，也不管是不是scrapy的事。

python - 使用Scrapy中的Request的时候，怎么把拿到的内容编码转换为utf-8?

全部回复(2)我来回复