>  Q&A  >  본문

python - 코딩 문제에 대한 도움말

크롤링하면서 얻은 내용은 b{"title":"u5173u6ce8","card_type_name":"u5173u6ce8"} 입니다. 인코딩을 한자로 변환하는 방법을 알려주세요
처음에 follow_text = follow라는 방법을 찾았습니다. text.encode('utf-8').decode('unicode-escape'),
첫 번째 응답은 이렇게 변환할 수 있지만 follow.text 변환에서는 'utf-8' 코덱이 해당 위치의 문자를 인코딩할 수 없다고 표시됩니다. 2809 -2810,
그런 다음 text[:2809]로 변경해 보면 오류가 보고되지 않습니다. text[2811:]로 변경해도 여전히 오류가 있습니다
print(follow.text[2800:2810])를 사용하세요. 그리고 출력은 '_image_url'입니다. 왜 변환이 실패했는지 모르겠습니다
문제가 무엇인지, 아니면 얻은 콘텐츠를 변환할 수 있는 다른 방법이 있는지 묻고 싶습니다

高洛峰高洛峰2702일 전648

모든 응답(2)나는 대답할 것이다

  • 阿神

    阿神2017-05-27 17:41:46

    만약 follow.text本身是 str(unicode) 的话,encode('utf8') 回去没有任何意义,直接 decode('unicode-escape') 괜찮다면

    만약 follow.text是 bytes 的话,那就可以选择先 decode('utf8') ,再 decode('unicode-escape')

    (질문의 올바른 인코딩이 utf8이라고 가정)

    회신하다
    0
  • 某草草

    某草草2017-05-27 17:41:46

    json을 사용하여 직접 디코딩할 수 있습니다

    회신하다
    0
  • 취소회신하다