php - 该选择哪个语言开发爬虫？

Question

需要开发个采集腾讯、新浪微博的评论数据。 如果直接使用官方提供的API，会有很多数据获取不到。所以可能得自己写了。 我主要是想使用C++来开发的，其次才是PHP。在没办法的情况下，才会考虑使用python进行开发！...

PHP中文网 · Answer

每个语言都可以，基本的爬虫只要涉及到一些HTTP请求和文档解析就能做出来。
Python有Scrapy等框架，上手比较快，可以研究一下。

高洛峰 · Answer

爬虫无非就是获取网页内容，解析内容，正则出想要的数据，其实对于网页内容获取，任何语言都能获取，注意代理服务器防封IP，并行抓取等技术，个人感觉php 获取网页内容还是不错的，至于解析网页内容，基本上都是DOM的操作，那最佳选择还是nodejs，里边的cheerio很好的解决树形结构数据。

高洛峰 · Answer

用javascript也可以写爬虫在云端编写和执行源码地址：
https://github.com/ShenJianSh...