python - 用scrapy写爬虫,发送请求后,服务器全都直接返回202,该怎么办呢?

Question

我爬取的是中国裁判文书网,之前还是好好的,我发送请求,服务器返回200,然后我处理body中的数据 但是一个星期之前,突然所有的请求都返回202,然后response body里也是空的,完全拿不到数据,我在回调函数中阻塞等待whi...

欧阳克 · Answer

这种情况通常是违规抓取，服务端进行了防抓取限制。如果是合法抓取的话，可以和内容方面沟通，看看是不是有误伤，如果是非法抓取，还建议不要这样做了，严重的话可能有被起诉的风险

过去多啦不再A梦 · Answer

被防采集了，可以试试换ip或寻找防采的限制漏洞