ruby - Nokogiri 抓取网页乱码如何解决？

Question

最近在帮同学在一个网站上抓取一些东西，比如 http://www.sell001.com/110178 上面的服装图片，标题和价格等等。 这个网站有点奇怪，他 meta 里面没有声明 charset，然后我用 Nokogiri ，也没有指定特定的 encodi...

阿神 · Answer

雷雷

=> #（文档：0x3fc3974355f4 {
名称=“文档”，
孩子们= [
#(DTD:0x3fc397424bf0 { name = "html" }),
#（元素：0x3fc39741fc18 {
名称=“html”，
属性 = [
#（属性：0x3fc39740fa20 {
名称 =“xmlns”，
值=“http://www.w3.org/1999/xhtml”
})],
孩子们= [
#(文字“rn”),
#（元素：0x3fc3973da190 {
名字=“头”，
孩子们= [
#(文字“rn”),
#（元素：0x3fc3973cf6dc {
名称=“标题”，
kids = [ #(Text "九天国际A218-网商园")]
}),

utf-8正常解析。。。

ruby - Nokogiri 抓取网页乱码如何解决？

全部回复(1)我来回复