Rumah > Soal Jawab > teks badan
单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教
欧阳克2016-11-21 10:20:47
如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup
soup = BeautifulSoup(html, from_encoding="gbk")
部分的文档
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding
解析网页的话, bs4很好用的orz