Python lxml の中国語解析に関する問題

Question

lxml を使用して中国語の文字をキャプチャすると、結果は非常に苦痛になります。対処方法がわかりません... {code...} 結果は次のようになります [u'\xe6\x80\xa7\xe8\xb4 \ xa8']unicode ですが、内容は str エンコーディングです。これを中国語に変換するにはどうすればよいですか? 通常は '\xe6\x80\xa7\xe8... であるはずです。

淡淡烟草味 · Answer

リーリー

滿天的星座 · Answer

これが発生する場合、通常はリクエストが Web ページの間違ったエンコーディングを推測したことが原因です
そのため、リクエストのエンコーディングを指定するだけです。
res.encoding ='utf-8'

リーリー

Python lxml の中国語解析に関する問題

全員に返信(2)返信します