搜尋

首頁  >  問答  >  主體

如何用node.js爬取动态数据

如何爬取动态数据,就是ajax请求的数据
比如说在代码中

<html>

<head>
<title>开课课程信息</title>
<meta name="GENERATOR" content="Microsoft FrontPage 3.0">
</head>

<frameset border="false" frameborder="0" rows="30,*">
  <frame name="header" scrolling="no" noresize target="frmCourMain" src="akcjj.asp" marginwidth="0"
  marginheight="0">
  <frame name="frmCourMain" src="akechengdw.asp" scrolling="auto" target="frmCourMain">
  <noframes>
  <body>
  <p>This page uses frames, but your browser doesn't support them.</p>
  </body>
  </noframes>
</frameset>
</html>

从代码中可以看出来源的数据是框架的akechengdw.asp,但是如何爬取这样的数据

大家讲道理大家讲道理2786 天前412

全部回覆(5)我來回復

  • 巴扎黑

    巴扎黑2017-04-17 15:40:59

    如果是ajax請求的資料的話,一般有兩種思路。

    1.是模擬瀏覽器去訪問。具體的可以穀歌模擬瀏覽器 爬蟲這個關鍵字,具體還是得自己實作。

    2.去找相關的接口,去爬接口,注意一些請求頭就可以了。

    回覆
    0
  • 巴扎黑

    巴扎黑2017-04-17 15:40:59

    F12看ajax請求,注意偽裝一下就行,例如user agent、referrer之類的。
    如果需要登入權限,那麼加上識別使用者的cookie就行,可以一個一個試試。
    如果有csrf防禦機制,那就找出埋點的csrf token附帶過去就行。

    回覆
    0
  • 阿神

    阿神2017-04-17 15:40:59

    兩種思路,補充樓上的

    模擬瀏覽器,一般可以用一些 headless broswer,Node 的話有一些包可以,例如 https://github.com/amir20/pha...

    回覆
    0
  • PHP中文网

    PHP中文网2017-04-17 15:40:59

    你至少貼個url吧, 建議你先去百度一下 “提問的藝術”,別說了這麼多, 都是口水話,提問題就要讓別人看得懂。

    回覆
    0
  • 大家讲道理

    大家讲道理2017-04-17 15:40:59

    phantomjs

    回覆
    0
  • 取消回覆