Rumah >hujung hadapan web >tutorial js >Nodejs抓取html页面内容

Nodejs抓取html页面内容

高洛峰asal: 2017-02-04 10:58:191991semak imbas

废话不多说，直接给大家贴node.js抓取html页面内容的核心代码了。

具体代码如下所示：

var http = require("http");
var iconv = require(&#39;iconv-lite&#39;);
var option = {
hostname: "stockdata.stock.hexun.com",
path: "/gszl/s601398.shtml"
};
var req = http.request(option, function(res) {
res.on("data", function(chunk) {
console.log(iconv.decode(chunk, "gbk"));
});
}).on("error", function(e) {
console.log(e.message);
});
req.end();

下面再看下面一种nodejs抓取网页内容

function loadPage(url) {
var http = require(&#39;http&#39;);
var pm = new Promise(function (resolve, reject) {
http.get(url, function (res) {
var html = &#39;&#39;;
res.on(&#39;data&#39;, function (d) {
html += d.toString()
});
res.on(&#39;end&#39;, function () {
resolve(html);
});
}).on(&#39;error&#39;, function (e) {
reject(e)
});
});
return pm;
}
loadPage(&#39;http://www.baidu.com&#39;).then(function (d) {
console.log(d);
});

更多Nodejs抓取html页面内容相关文章请关注PHP中文网！

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：nodeJS删除文件方法示例Artikel seterusnya：nodejs如何获取时间戳与时间差

Artikel berkaitan

Lihat lagi