本人前端一枚
想做一个demo练手,需要得到爬取数据的本领,请问从哪里开始学习呢?
场景:爬取商品价格的数据,得到双十一前后的价格趋势变化,我可以如何入手呢?
我是JavaScript使用者,尽量使用node,如果Python学习成本比较高,求推荐教程和爬取数据的方法
欧阳克2016-11-17 14:46:33
Python的学习成本不是很高,我说说我的经历吧
最开始我用urllib,或者urllib2,发现能够爬到数据很兴奋
接下来我见识到了Connection是Closed的网页,我知道了httplib2
然后又看到了requests
现在在看scrapy
爬虫是个玄学,我觉得题主的目标不错查询价格变化趋势,但是我觉得可以先定个小目标,爬百度百科~
三叔2016-11-17 14:46:11
爬虫工具链:
使用superagent发起一个http请求,拿到response之后使用cheerio解析text文本,之后可以使用类似jQuery语法操作Dom。
数据存贮可以使用Mongodb,对应的orm工具可以使用mongoose。