搜索

首页  >  问答  >  正文

javascript - 用python写爬虫的时候,对于js的页面内容如何抓取

自己先搜了一下,发现要解析js就必须得用一个js解析器,或者直接使用webkit这样的网页解析,但都没有成熟的做法, 想问一下是否有开源的较成熟的解决方案?

PHPzPHPz2894 天前794

全部回复(6)我来回复

  • 高洛峰

    高洛峰2017-04-10 14:32:31

    当然有。搜索关键词“Headless browser”

    比如http://phantomjs.org/

    回复
    0
  • PHP中文网

    PHP中文网2017-04-10 14:32:31

    必须是 http://jeanphix.me/Ghost.py/

    ghost.py is a webkit web client written in python.

    回复
    0
  • 高洛峰

    高洛峰2017-04-10 14:32:31

    SF五大月经贴之JS动态页面的抓取:http://segmentfault.com/q/1010000000581910#a-1020000000582320

    回复
    0
  • 巴扎黑

    巴扎黑2017-04-10 14:32:31

    其实你分析一下js,完全不必用那些环境。

    回复
    0
  • ringa_lee

    ringa_lee2017-04-10 14:32:31

    spidermonkey

    回复
    0
  • 巴扎黑

    巴扎黑2017-04-10 14:32:31

    QPython上面怎么获取js加载后的内容?

    回复
    0
  • 取消回复