首頁 >web前端 >js教程 >在Node.js中使用cheerio製作簡單的網頁爬蟲（詳細教學）

在Node.js中使用cheerio製作簡單的網頁爬蟲（詳細教學）

亚连原創: 2018-06-02 14:30:033517瀏覽

本篇文章主要介紹了Node.js 利用cheerio製作簡單的網頁爬蟲範例，現在分享給大家，也給大家做個參考。

本文介紹了Node.js 利用cheerio製作簡單的網頁爬蟲範例，分享給大家，具有如下：

1. 目標

完成對網站的標題資訊取得
將取得到的資訊輸出在一個新檔案
工具: cheerio，使用npm下載npm install cheerio
cheerio的API使用方法和jQuery的使用方法基本上一致
如果熟練使用jQuery，那麼cheerio將會很快上手

2. 程式碼部分

介紹: 取得segment fault頁面的清單標題，將取得到的標題清單編號，最後輸出到pageTitle.txt檔案裡

const https = require(&#39;https&#39;);
const fs = require(&#39;fs&#39;);
const cheerio = require(&#39;cheerio&#39;);
const url = &#39;https://segmentfault.com/&#39;;

https.get(url, (res) => {
  let html = &#39;&#39;;
  res.on(&#39;data&#39;, (data) => {
    html += data;
  });
  res.on(&#39;end&#39;, () => {
    getPageTitle(html);
  });
}).on(&#39;error&#39;, () => {
  console.log(&#39;获取网页信息错误&#39;);
});

function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $(&#39;.news__item-title&#39;);
  let data = [];
  let index = 0;
  let fileName = &#39;pageTitle.txt&#39;;
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find(&#39;a&#39;).text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, &#39;utf8&#39;, (err) => {
    if (err) {
      console.log(&#39;fs文件系统创建新文件失败&#39;, err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}

上面是我整理給大家的，希望未來會對大家有幫助。

聊聊JS動畫庫Velocity.js的使用

vue toggle做一個點擊切換class(實例講解)

Vue2.0 給Tab標籤頁和頁面切換過渡新增樣式的方法

以上是在Node.js中使用cheerio製作簡單的網頁爬蟲（詳細教學）的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：如何使用vue源碼解析事件機制下一篇：如何使用vue源碼解析事件機制

看更多