ホームページ  >  に質問  >  本文

python lxml解析gbk

单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教

高洛峰高洛峰2911日前1293

全員に返信(2)返信します

  • 欧阳克

    欧阳克2016-11-21 10:20:47

    如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup

    soup = BeautifulSoup(html, from_encoding="gbk")

    部分的文档

    https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding

    解析网页的话, bs4很好用的orz

    返事
    0
  • 三叔

    三叔2016-11-21 10:19:34

    把你的文本 .decode(encoding="gbk")输出试试

    返事
    0
  • キャンセル返事