搜索

首页  >  问答  >  正文

python - 爬虫抓取数据页一直返回HTTP code 417

同一份代码在本地测试请求数据页返回200,

但是在线上之前请求的步骤都可以成功请求到,到请求数据页这步一直返回417

用Advanced REST client在本地模拟这段请求也是可以通过的

查了一下原因,有可能是服务器被识别被封了,如果是这样请问如何解决?谢谢

黄舟黄舟2769 天前606

全部回复(2)我来回复

  • 大家讲道理

    大家讲道理2017-04-17 16:48:03

    爬虫有两点很重要,控制抓爬频率,使用代理抓爬,慢一点没关系,持久有效才是目标。

    回复
    0
  • PHPz

    PHPz2017-04-17 16:48:03

    很可能是服务器因为采集数据过多被封了,这样只能使用HTTP代理了

    回复
    0
  • 取消回复