recherche

Maison  >  Questions et réponses  >  le corps du texte

python - scrapy capture le contenu en double de la réponse CNKI

Parcourez l'URL demandant de tourner la page

for i in range(3):
    yield Request("http:xx/page/%s"%str(i),callback=self.parse_page)

Le résultat est que la demande de réponse réussit, mais le contenu est le même à chaque fois. Cependant, utiliser Postman pour demander les URL paginées séparément ne pose pas ce problème. = = Avez-vous été banni ? Cela n'a jamais été comme ça auparavant

黄舟黄舟2761 Il y a quelques jours996

répondre à tous(3)je répondrai

  • 怪我咯

    怪我咯2017-06-30 09:57:07

    Ensuite, nous devons analyser la différence entre les en-têtes demandés lors de l'accès à l'aide de Postman ou d'un navigateur et la demande d'en-têtes à l'aide de Scrapy

    répondre
    0
  • 三叔

    三叔2017-06-30 09:57:07

    Reconnu par anti-crawling

    répondre
    0
  • PHP中文网

    PHP中文网2017-06-30 09:57:07

    Regardez le journal imprimé par la console pour voir si la page suivante a été explorée correctement
    2017-06-29 09:26:13 [scrapy] DEBUG : gratté de <200 http:xx/page/x>,
    Faites attention à savoir si le dernier x (http:xx/page/x) a changé

    répondre
    0
  • Annulerrépondre