nodejs实现爬取网站图片功能_node.js-js教程-PHP中文网

首页

web前端

js教程

nodejs实现爬取网站图片功能_node.js

韦小宝

Dec 16, 2017 am 09:15 AM

javascriptnodejs功能

给大家通过一个实例来教学如何用nodejs实现爬取网站图片功能，有兴趣的朋友收藏一下吧。

通过实例给大家讲解nodejs实现爬取网站图片功能，以下就是全部内容：

原理：

爬虫是最明显的IO密集型应用场景，显然用node，使得I/O等待开销小数据挖掘比较方便

借助express模块来搭建node服务

并使用request模块获取目标页面的html代码

下载cheerio模块对html代码做处理(cheerio类似jQuery的语法，所以好用又方便)

环境配置：

npm install express request cheerio --save

(1)引入各个模块

var http = require(&#39;http&#39;);
var request = require(&#39;request);
var cheerio = require(&#39;cheerio&#39;);
var fs = require(&#39;fs&#39;); //用来操作文件
var url = &#39;https://movie.douban.com/cinema/nowplaying/beijing/&#39; //定义要爬的页面

(2)发送请求

http.get(function(res){
  var html = &#39;&#39;;
  var titles = [];
  res.setEncoding(&#39;utf-8&#39;) //防止中文乱码
  res.on(&#39;data&#39;,function(chunk){
    html += chrunk;    //监听data事件 每次取一块数据
  })
  res.on(&#39;end&#39;,function(){
    var $ = cheerio.load(html);  //获取数据完成后，解析html
    //将获取的图片存到images文件夹中
    $(&#39;.mod-bd img&#39;).each(function(index, item){
      //获取图片属性
      var imgName = $(this).parent().next().text().trimg()
      var imgfile = imgName + &#39;.jpeg&#39;;
      var imgSrc = $(this).attr(&#39;src&#39;)
      //采用request模块，向服务器发起请求 获取图片资源
      request.head(imgSrc, function(error, res,body){
        if(error){
          console.log(&#39;失败了&#39;)
        }
      });
      //通过管道的方式用fs模块将图片写到本地的images文件下
      request(imgSrc).pipe.(fs.createWriteStream(&#39;./images/&#39; + imgfile));
    })
    
  })
})

以上就是本文的所有内容，希望会给小伙伴们带来帮助！！

相关推荐：

NodeJS爬虫实例之糗事百科_node.js

NodeJs之关于数据库异常处理的解决方法

如何用nodejs实现聊天功能

以上是nodejs实现爬取网站图片功能_node.js的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

JavaScript框架：为现代网络开发提供动力May 02, 2025 am 12:04 AM

JavaScript框架的强大之处在于简化开发、提升用户体验和应用性能。选择框架时应考虑：1.项目规模和复杂度，2.团队经验，3.生态系统和社区支持。

JavaScript，C和浏览器之间的关系May 01, 2025 am 12:06 AM

引言我知道你可能会觉得奇怪，JavaScript、C 和浏览器之间到底有什么关系？它们之间看似毫无关联，但实际上，它们在现代网络开发中扮演着非常重要的角色。今天我们就来深入探讨一下这三者之间的紧密联系。通过这篇文章，你将了解到JavaScript如何在浏览器中运行，C 在浏览器引擎中的作用，以及它们如何共同推动网页的渲染和交互。JavaScript与浏览器的关系我们都知道，JavaScript是前端开发的核心语言，它直接在浏览器中运行，让网页变得生动有趣。你是否曾经想过，为什么JavaScr

node.js流带打字稿Apr 30, 2025 am 08:22 AM

Node.js擅长于高效I/O，这在很大程度上要归功于流。流媒体汇总处理数据，避免内存过载 - 大型文件，网络任务和实时应用程序的理想。将流与打字稿的类型安全结合起来创建POWE

Python vs. JavaScript：性能和效率注意事项Apr 30, 2025 am 12:08 AM

Python和JavaScript在性能和效率方面的差异主要体现在：1)Python作为解释型语言，运行速度较慢，但开发效率高，适合快速原型开发；2)JavaScript在浏览器中受限于单线程，但在Node.js中可利用多线程和异步I/O提升性能，两者在实际项目中各有优势。

JavaScript的起源：探索其实施语言Apr 29, 2025 am 12:51 AM

JavaScript起源于1995年，由布兰登·艾克创造，实现语言为C语言。1.C语言为JavaScript提供了高性能和系统级编程能力。2.JavaScript的内存管理和性能优化依赖于C语言。3.C语言的跨平台特性帮助JavaScript在不同操作系统上高效运行。

幕后：什么语言能力JavaScript？Apr 28, 2025 am 12:01 AM

JavaScript在浏览器和Node.js环境中运行，依赖JavaScript引擎解析和执行代码。1）解析阶段生成抽象语法树（AST）；2）编译阶段将AST转换为字节码或机器码；3）执行阶段执行编译后的代码。

Python和JavaScript的未来：趋势和预测Apr 27, 2025 am 12:21 AM

Python和JavaScript的未来趋势包括：1.Python将巩固在科学计算和AI领域的地位，2.JavaScript将推动Web技术发展，3.跨平台开发将成为热门，4.性能优化将是重点。两者都将继续在各自领域扩展应用场景，并在性能上有更多突破。

Python vs. JavaScript：开发环境和工具Apr 26, 2025 am 12:09 AM

Python和JavaScript在开发环境上的选择都很重要。1)Python的开发环境包括PyCharm、JupyterNotebook和Anaconda，适合数据科学和快速原型开发。2)JavaScript的开发环境包括Node.js、VSCode和Webpack，适用于前端和后端开发。根据项目需求选择合适的工具可以提高开发效率和项目成功率。

See all articles