ruby - Nokogiri 抓取網頁亂碼如何解決？

Question

最近在幫同學在一個網站上抓取一些東西，例如 http://www.sell001.com/110178 上面的服裝圖片，標題和價格等等。 這個網站有點奇怪，他 meta 裡面沒有聲明 charset，然後我用 Nokogiri ，也沒有指定特定的 encodi...

阿神 · Answer

雷雷

=> #（文件：0x3fc3974355f4 {
名稱=“文檔”，
孩子= [
#(DTD:0x3fc397424bf0 { name = "html" }),
#（元素：0x3fc39741fc18 {
名稱=“html”，
屬性 = [
#（屬性：0x3fc39740fa20 {
名稱 =“xmlns”，
值=“http://www.w3.org/1999/xhtml”
})],
孩子= [
#(文字“rn”),
#（元素：0x3fc3973da190 {
名字=“頭”，
孩子= [
#(文字“rn”),
#（元素：0x3fc3973cf6dc {
名稱=“標題”，
kids = [ #(Text "九天國際A218-網商園")]
}),

utf-8正常解析。。。

ruby - Nokogiri 抓取網頁亂碼如何解決？

全部回覆(1)我來回復