>  Q&A  >  본문

Python lxml 구문 분석 중국어 문제

lxml을 사용하여 한자를 캡처했는데 결과가 너무 고통스러워 어떻게 처리해야할지 모르겠습니다...

으아악

결과는 [u'xe6x80xa7xe8xb4xa8']
유니코드인데 내용은 str 인코딩입니다. 이것을 중국어로 어떻게 변환하나요?
보통은 'xe6x80xa7xe8xb4xa8' 또는 u'u6027u8d28'이어야 합니다

高洛峰高洛峰2712일 전568

모든 응답(2)나는 대답할 것이다

  • 淡淡烟草味

    淡淡烟草味2017-05-18 10:46:31

    으아아아

    회신하다
    0
  • 滿天的星座

    滿天的星座2017-05-18 10:46:31

    이런 일이 발생하는 경우는 일반적으로 요청이 웹 페이지의 잘못된 인코딩을 추측했기 때문입니다
    그러므로 요청의 인코딩을 지정하기만 하면 됩니다.
    res.encoding ='utf-8'

    으아아아

    회신하다
    0
  • 취소회신하다