首頁  >  問答  >  主體

python - scrapy抓取知網response的內容重複

遍歷請求翻頁的url

for i in range(3):
    yield Request("http:xx/page/%s"%str(i),callback=self.parse_page)

結果response請求成功 但是每次內容都一樣的沒變化都是第一次請求時的內容,但是用postman分別請求分頁的url就沒有這問題。 = = 是被ban了嗎 之前就不會這樣

黄舟黄舟2689 天前959

全部回覆(3)我來回復

  • 怪我咯

    怪我咯2017-06-30 09:57:07

    那就要分析一下用postman或是瀏覽器存取時請求的header頭和用scrapy請求頭有什麼差別

    回覆
    0
  • 三叔

    三叔2017-06-30 09:57:07

    被反爬識別到了

    回覆
    0
  • PHP中文网

    PHP中文网2017-06-30 09:57:07

    看下控制台列印的log,看看是否正確抓取了下一頁
    2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,
    注意最後一個x(http:xx/page/x)是否是變化的

    回覆
    0
  • 取消回覆