python - 爬虫获取网站数据，出现乱码怎么解决。

Question

{代码...} 以上是代码，写的很简单，但是print出来的是乱码尝试了 print str.decode(“utf-8“”)但是报错UnicodeDecodeError: 'utf8' codec can't decode byte 0x8b in position 1: invalid start byte

PHP中文网 · Answer

str = response.read()這句有兩個問題：
1、str是內建關鍵字必須改為其他變數名稱
2、檢視網頁原始碼的編碼方式，如果為utf-8在read()後加.decode('utf-8')，若為其他可以對應解碼

小建議這種小程式寫個函數會比用類別來更方便，無論是使用還是實作

巴扎黑 · Answer

推測用的是sublime text？
參考這個

伊谢尔伦 · Answer

這兒應該是encode不是decode，而且你的變數名居然是跟內建關鍵字名字一樣

怪我咯 · Answer

應該是encode吧

python - 爬虫获取网站数据，出现乱码怎么解决。

全部回覆(4)我來回復