Heim >Web-Frontend >js-Tutorial >Nodejs crawlt den Inhalt von HTML-Seiten
Ohne weitere Umschweife werde ich direkt den Kerncode für node.js veröffentlichen, um den Inhalt von HTML-Seiten zu erfassen.
Der spezifische Code lautet wie folgt:
var http = require("http"); var iconv = require('iconv-lite'); var option = { hostname: "stockdata.stock.hexun.com", path: "/gszl/s601398.shtml" }; var req = http.request(option, function(res) { res.on("data", function(chunk) { console.log(iconv.decode(chunk, "gbk")); }); }).on("error", function(e) { console.log(e.message); }); req.end();
Weitere Artikel zum Erfassen von HTML-Seiteninhalten durch Nodejs finden Sie auf der chinesischen PHP-Website!
function loadPage(url) { var http = require('http'); var pm = new Promise(function (resolve, reject) { http.get(url, function (res) { var html = ''; res.on('data', function (d) { html += d.toString() }); res.on('end', function () { resolve(html); }); }).on('error', function (e) { reject(e) }); }); return pm; } loadPage('http://www.baidu.com').then(function (d) { console.log(d); });