Rumah  >  Soal Jawab  >  teks badan

python - membantu dengan isu pengekodan

Kandungan yang saya dapat semasa merangkak adalah seperti ini b{"title":"u5173u6ce8","card_type_name":"u5173u6ce8"}. Sila beritahu saya cara menukar pengekodan kepada aksara Cina
Saya mula-mula menemui kaedah follow_text = follow. text.encode('utf-8').decode('unicode-escape'),
Respons pertama boleh ditukar seperti ini, tetapi follow.text conversion akan menunjukkan codec 'utf-8' tidak boleh mengekod aksara dalam kedudukan 2809 -2810,
Kemudian cuba tukar kepada teks[:2809], tiada ralat akan dilaporkan, tukar kepada teks[2811:], masih ada ralat
Gunakan print(follow.text[2800:2810]) dan outputnya ialah '_image_url', saya tidak tahu mengapa Penukaran tidak berjaya
Saya ingin bertanya apa masalahnya, atau jika ada cara lain untuk menukar kandungan yang saya dapat

高洛峰高洛峰2702 hari yang lalu650

membalas semua(2)saya akan balas

  • 阿神

    阿神2017-05-27 17:41:46

    Jika follow.text itu sendiri adalah str(unicode), pengekodan('utf8') tidak masuk akal, hanya decode('unicode-escape') akan berjayafollow.text本身是 str(unicode) 的话,encode('utf8') 回去没有任何意义,直接 decode('unicode-escape') 就行

    如果 follow.text是 bytes 的话,那就可以选择先 decode('utf8') ,再 decode('unicode-escape')

    Jika follow.text ialah bait, anda boleh memilih untuk menyahkod('utf8') dahulu, kemudian menyahkod('unicode-escape')

    (dengan andaian pengekodan yang betul dalam soalan anda ialah utf8)🎜

    balas
    0
  • 某草草

    某草草2017-05-27 17:41:46

    Anda hanya boleh menggunakan json untuk menyahkodnya secara terus

    balas
    0
  • Batalbalas