Rumah > Soal Jawab > teks badan
Kod yang sama tidak boleh lulus dalam persekitaran Notepad (diuji dengan Notepad), tetapi boleh lulus dalam Pycharm (Python3.5)
Kod:
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data = data.decode('UTF-8')
Pernyataan ini boleh diluluskan dalam kedua-dua persekitaran
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Paparkan halaman web yang dirangkak dalam Pycharm dan paparkannya dalam tetingkap cmd
UnicodeEncodeError: codec 'gbk' tidak boleh mengekod aksara 'xbb' dalam kedudukan 26830:
jujukan multibait haram
Aksara tidak sah mesti dialih keluar.
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Saya boleh hidup begini, tolong jelaskan
淡淡烟草味2017-05-18 10:52:11
Anda mungkin menghadapi masalah pengekodan python yang sama seperti saya, atau masalah sokongan pengekodan terminal yang anda gunakan. Lihat soalan di bawah.
【Masalah pengekodan python? 】Dikongsi daripada @SegmentFault, portal: /q/10...