recherche

Maison  >  Questions et réponses  >  le corps du texte

前端er 想爬数据 从什么入门好?

本人前端一枚

想做一个demo练手,需要得到爬取数据的本领,请问从哪里开始学习呢?

场景:爬取商品价格的数据,得到双十一前后的价格趋势变化,我可以如何入手呢?

我是JavaScript使用者,尽量使用node,如果Python学习成本比较高,求推荐教程和爬取数据的方法


高洛峰高洛峰2930 Il y a quelques jours757

répondre à tous(2)je répondrai

  • 欧阳克

    欧阳克2016-11-17 14:46:33

    Python的学习成本不是很高,我说说我的经历吧
    最开始我用urllib,或者urllib2,发现能够爬到数据很兴奋
    接下来我见识到了Connection是Closed的网页,我知道了httplib2
    然后又看到了requests
    现在在看scrapy

    爬虫是个玄学,我觉得题主的目标不错查询价格变化趋势,但是我觉得可以先定个小目标,爬百度百科~


    répondre
    0
  • 三叔

    三叔2016-11-17 14:46:11

    爬虫工具链:

    使用superagent发起一个http请求,拿到response之后使用cheerio解析text文本,之后可以使用类似jQuery语法操作Dom。

    数据存贮可以使用Mongodb,对应的orm工具可以使用mongoose。


    répondre
    0
  • Annulerrépondre