ホームページ  >  記事  >  ウェブフロントエンド  >  Nodejs は HTML ページのコンテンツをクロールします

Nodejs は HTML ページのコンテンツをクロールします

高洛峰
高洛峰オリジナル
2017-02-04 10:58:191879ブラウズ

これ以上の手間は省き、HTML ページのコンテンツをキャプチャするための Node.js のコア コードを投稿します。

具体的なコードは次のとおりです:

var http = require("http");
var iconv = require('iconv-lite');
var option = {
hostname: "stockdata.stock.hexun.com",
path: "/gszl/s601398.shtml"
};
var req = http.request(option, function(res) {
res.on("data", function(chunk) {
console.log(iconv.decode(chunk, "gbk"));
});
}).on("error", function(e) {
console.log(e.message);
});
req.end();

Web コンテンツをキャプチャする次の Nodejs を見てみましょう

function loadPage(url) {
var http = require('http');
var pm = new Promise(function (resolve, reject) {
http.get(url, function (res) {
var html = '';
res.on('data', function (d) {
html += d.toString()
});
res.on('end', function () {
resolve(html);
});
}).on('error', function (e) {
reject(e)
});
});
return pm;
}
loadPage('http://www.baidu.com').then(function (d) {
console.log(d);
});

Nodejs による HTML ページ コンテンツのキャプチャに関するその他の記事については、PHP 中国語 Web サイトに注目してください。 !


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。