搜尋
首頁web前端js教程node.js實作微信小程式抓取網頁內容

node.js實作微信小程式抓取網頁內容

Oct 20, 2018 pm 05:17 PM
cheerionode.js微信小程式網頁抓取

這篇文章帶給大家的內容是關於node.js實作微信小程式抓取網頁內容,有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。

最近在研究微信小程式的雲端開發功能。雲端開發最大的好處就是不需要前端搭建伺服器,可以使用雲端能力,從零開始寫出來一個能上線的微信小程序,避免了買伺服器的開銷,對於個人來嘗試練手微信小程序從前端到後台的開發,還是不錯的選擇。可以做到一天就能上線一個微信小程式。

雲端開發的優點

雲端開發為開發者提供完整的雲端支持,弱化後端和維運概念,無需搭建伺服器,使用平台提供的API進行核心業務開發,即可實現快速上線和迭代,同時這項能力,同開發者已經使用的雲端服務相互相容,並不互斥。

雲端開發目前提供三大基礎能力支援:

  1. 雲端函數:在雲端運行的程式碼,微信私有協定天然鑑權,開發者只需編寫自身業務邏輯代碼

  2. 資料庫:一個既可在小程式前端操作,也能在雲端函數中讀寫的JSON 資料庫

  3. 存儲:在小程式前端直接上傳/下載雲端文件,在雲端開發控制台可視化管理

好了,介紹了這麼多關於雲端開發的知識,感性的同學可以去研究研究。官方文件網址:https://developers.weixin.qq....

網頁內容抓取

小程式是關於答案的,所以題目的來源是一個問題。上網搜,一個題目一個題目貼是一種方法,但是這樣的重複工作,估計黏個10左右就想放棄了。所以想到了網頁抓取。正好把之前學的node撿起來。

必備工具:

  1. Cheerio。一個類似伺服器端JQuery的套件。主要用它來分析和過濾抓取來的內容。

  2. node的fs模組。這個是node自備的模組,用來讀寫檔案的。此處用來將解析好的資料寫入json檔。

  3. Axios(非必須)。用來抓取網站的HTML網頁。因為我要的資料是從網頁點選一個button後取得渲染的,所以直接造訪這個網址是抓取不到的。無奈只能將想要的內容複製出來,存成字串,去解析這個字串。

接下來就可以用npm init來初始化一個node項目,一路回車後,即可產生一個package.json檔案。
然後npm install --save axios cheerio安裝cheerio和axios套件。

關鍵的是用cheerio來實作一個類似jquery的功能。只要將抓取到的內容cheerio.load(quesitons)一下即可,之後就可以按照jquery的操作取dom,組裝你想要的資料了。

最後用fs.writeFile將資料儲存到json檔案中,大功告成。

具體程式碼如下

let axios = require("axios");

let cheerio = require("cheerio");

let fs = require("fs");

// 我的html结构大致如下,有很多条数据
const questions = `
  •       
            
    举头望明月,__________。
            
              回首白云低         
            
              低头思故乡         
            
              当春乃发生         
            
              红掌拨清波         
          
        
  •     
  •       
            
    __________,却话巴山夜雨时。
            
              何当共剪西窗烛         
            
              在天愿做比翼鸟         
            
              世味年来薄似纱         
            
              两岸青山相对出         
          
        
  •     ..........     `;      const $ = cheerio.load(quesitons); var arr = []; for (var i = 0; i  {    if (err) throw err;    console.log("json文件已成功保存!"); });

    儲存到json後的檔案格式如下,這樣就可以透過json檔案上傳到雲端伺服器了。

    node.js實作微信小程式抓取網頁內容

    #注意事項

    #微信小程式雲開發的資料庫,上傳json檔案的資料格式需要注意一下,之前一直提示格式錯誤,後來才發現,JSON 資料不是數組,而是類似JSON Lines,即各個記錄物件之間使用n 分隔,而非逗號。所以還需要對node寫出來的json檔案做一個小處理之後才能上傳成功。

    #

    以上是node.js實作微信小程式抓取網頁內容的詳細內容。更多資訊請關注PHP中文網其他相關文章!

    陳述
    本文轉載於:segmentfault思否。如有侵權,請聯絡admin@php.cn刪除
    Python vs. JavaScript:開發環境和工具Python vs. JavaScript:開發環境和工具Apr 26, 2025 am 12:09 AM

    Python和JavaScript在開發環境上的選擇都很重要。 1)Python的開發環境包括PyCharm、JupyterNotebook和Anaconda,適合數據科學和快速原型開發。 2)JavaScript的開發環境包括Node.js、VSCode和Webpack,適用於前端和後端開發。根據項目需求選擇合適的工具可以提高開發效率和項目成功率。

    JavaScript是用C編寫的嗎?檢查證據JavaScript是用C編寫的嗎?檢查證據Apr 25, 2025 am 12:15 AM

    是的,JavaScript的引擎核心是用C語言編寫的。 1)C語言提供了高效性能和底層控制,適合JavaScript引擎的開發。 2)以V8引擎為例,其核心用C 編寫,結合了C的效率和麵向對象特性。 3)JavaScript引擎的工作原理包括解析、編譯和執行,C語言在這些過程中發揮關鍵作用。

    JavaScript的角色:使網絡交互和動態JavaScript的角色:使網絡交互和動態Apr 24, 2025 am 12:12 AM

    JavaScript是現代網站的核心,因為它增強了網頁的交互性和動態性。 1)它允許在不刷新頁面的情況下改變內容,2)通過DOMAPI操作網頁,3)支持複雜的交互效果如動畫和拖放,4)優化性能和最佳實踐提高用戶體驗。

    C和JavaScript:連接解釋C和JavaScript:連接解釋Apr 23, 2025 am 12:07 AM

    C 和JavaScript通過WebAssembly實現互操作性。 1)C 代碼編譯成WebAssembly模塊,引入到JavaScript環境中,增強計算能力。 2)在遊戲開發中,C 處理物理引擎和圖形渲染,JavaScript負責遊戲邏輯和用戶界面。

    從網站到應用程序:JavaScript的不同應用從網站到應用程序:JavaScript的不同應用Apr 22, 2025 am 12:02 AM

    JavaScript在網站、移動應用、桌面應用和服務器端編程中均有廣泛應用。 1)在網站開發中,JavaScript與HTML、CSS一起操作DOM,實現動態效果,並支持如jQuery、React等框架。 2)通過ReactNative和Ionic,JavaScript用於開發跨平台移動應用。 3)Electron框架使JavaScript能構建桌面應用。 4)Node.js讓JavaScript在服務器端運行,支持高並發請求。

    Python vs. JavaScript:比較用例和應用程序Python vs. JavaScript:比較用例和應用程序Apr 21, 2025 am 12:01 AM

    Python更適合數據科學和自動化,JavaScript更適合前端和全棧開發。 1.Python在數據科學和機器學習中表現出色,使用NumPy、Pandas等庫進行數據處理和建模。 2.Python在自動化和腳本編寫方面簡潔高效。 3.JavaScript在前端開發中不可或缺,用於構建動態網頁和單頁面應用。 4.JavaScript通過Node.js在後端開發中發揮作用,支持全棧開發。

    C/C在JavaScript口譯員和編譯器中的作用C/C在JavaScript口譯員和編譯器中的作用Apr 20, 2025 am 12:01 AM

    C和C 在JavaScript引擎中扮演了至关重要的角色,主要用于实现解释器和JIT编译器。1)C 用于解析JavaScript源码并生成抽象语法树。2)C 负责生成和执行字节码。3)C 实现JIT编译器,在运行时优化和编译热点代码,显著提高JavaScript的执行效率。

    JavaScript在行動中:現實世界中的示例和項目JavaScript在行動中:現實世界中的示例和項目Apr 19, 2025 am 12:13 AM

    JavaScript在現實世界中的應用包括前端和後端開發。 1)通過構建TODO列表應用展示前端應用,涉及DOM操作和事件處理。 2)通過Node.js和Express構建RESTfulAPI展示後端應用。

    See all articles

    熱AI工具

    Undresser.AI Undress

    Undresser.AI Undress

    人工智慧驅動的應用程序,用於創建逼真的裸體照片

    AI Clothes Remover

    AI Clothes Remover

    用於從照片中去除衣服的線上人工智慧工具。

    Undress AI Tool

    Undress AI Tool

    免費脫衣圖片

    Clothoff.io

    Clothoff.io

    AI脫衣器

    Video Face Swap

    Video Face Swap

    使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

    熱工具

    記事本++7.3.1

    記事本++7.3.1

    好用且免費的程式碼編輯器

    PhpStorm Mac 版本

    PhpStorm Mac 版本

    最新(2018.2.1 )專業的PHP整合開發工具

    SAP NetWeaver Server Adapter for Eclipse

    SAP NetWeaver Server Adapter for Eclipse

    將Eclipse與SAP NetWeaver應用伺服器整合。

    MinGW - Minimalist GNU for Windows

    MinGW - Minimalist GNU for Windows

    這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

    VSCode Windows 64位元 下載

    VSCode Windows 64位元 下載

    微軟推出的免費、功能強大的一款IDE編輯器