python - 爬虫获取网站数据，出现乱码怎么解决。

Question

{代码...} 以上是代码，写的很简单，但是print出来的是乱码尝试了 print str.decode(“utf-8“”)但是报错UnicodeDecodeError: 'utf8' codec can't decode byte 0x8b in position 1: invalid start byte

PHP中文网 · Answer

str = response.read()这句有两个问题：
1、str是内置关键字必须更改为其他变量名
2、查看网页源代码的编码方式，如果为utf-8在read()后加.decode('utf-8')，若为其他可以相应解码

小建议这种小程序写个函数会比用类来更加方便，无论是使用还是实现

巴扎黑 · Answer

推测用的是sublime text？
参考这个

伊谢尔伦 · Answer

这儿应该是encode不是decode，而且你的变量名居然是跟内置关键字名字一样

怪我咯 · Answer

应该是encode吧

python - 爬虫获取网站数据，出现乱码怎么解决。

Antworte allen(4)Ich werde antworten