Rumah > Soal Jawab > teks badan
Kandungan yang saya dapat semasa merangkak adalah seperti ini b{"title":"u5173u6ce8","card_type_name":"u5173u6ce8"}. Sila beritahu saya cara menukar pengekodan kepada aksara Cina
Saya mula-mula menemui kaedah follow_text = follow. text.encode('utf-8').decode('unicode-escape'),
Respons pertama boleh ditukar seperti ini, tetapi follow.text conversion akan menunjukkan codec 'utf-8' tidak boleh mengekod aksara dalam kedudukan 2809 -2810,
Kemudian cuba tukar kepada teks[:2809], tiada ralat akan dilaporkan, tukar kepada teks[2811:], masih ada ralat
Gunakan print(follow.text[2800:2810]) dan outputnya ialah '_image_url', saya tidak tahu mengapa Penukaran tidak berjaya
Saya ingin bertanya apa masalahnya, atau jika ada cara lain untuk menukar kandungan yang saya dapat
阿神2017-05-27 17:41:46
Jika follow.text
itu sendiri adalah str(unicode), pengekodan('utf8') tidak masuk akal, hanya decode('unicode-escape')
akan berjayafollow.text
本身是 str(unicode) 的话,encode('utf8') 回去没有任何意义,直接 decode('unicode-escape')
就行
如果 follow.text
是 bytes 的话,那就可以选择先 decode('utf8') ,再 decode('unicode-escape')
follow.text
ialah bait, anda boleh memilih untuk menyahkod('utf8') dahulu, kemudian menyahkod('unicode-escape')
(dengan andaian pengekodan yang betul dalam soalan anda ialah utf8)🎜