Python – Scrapy erfasst doppelten Inhalt der CNKI-Antwort

Question

Beim Durchlaufen der URL {code...}, die das Umblättern anfordert, ist die Antwortanforderung jedes Mal derselbe. Dies ist jedoch nicht der Fall, wenn Postman zum separaten Anfordern der Paging-URLs verwendet wird habe dieses Problem. = = Wurden Sie gesperrt? Das war noch nie so.

怪我咯 · Answer

那就要分析一下用postman或者浏览器访问时请求的header头和用scrapy请求头有什么区别

三叔 · Answer

被反爬识别到了

PHP中文网 · Answer

看下控制台打印的log，看看是否正确抓取了下一页
2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,
注意最后一个x(http:xx/page/x)是否是变化的

Python – Scrapy erfasst doppelten Inhalt der CNKI-Antwort

Antworte allen(3)Ich werde antworten