node.js - node爬虫，如何使用IP池防反爬？

Question

问题是这样的，本菜鸟刚开始学node，当然，明显是冲着爬虫去的。然后我最近在看一本小说，但是那些免费的小说网站广告太多，所以计划写个爬虫把整本小说爬下来，但是遇到url请求次数太频繁，以至于会遭反爬，被屏...

高洛峰 · Answer

防反爬，就是控制程序不能使用一个ip地址以非常快的频率多次抓取同一个网站，那么思路来了，现在拥有一个ip池，则程序可以使用多个ip发起请求，这时要做的就是定期更换程序使用的ip,比如根据你的抓取频率，半个小时，或者半天，或者更长时间为一次间隔，时间到了，就为爬虫程序替换一个ip.这有一条链接，node代理，或许有用/q/10...

node.js - node爬虫，如何使用IP池防反爬？

全部回复(1)我来回复