recherche

Maison  >  Questions et réponses  >  le corps du texte

python - Comment combiner les données de deux pages différentes dans Scrapy et les stocker ensemble

1 Par exemple, il y a une page de liste de blogs a, pour obtenir la liste des articles
2 Page de détails du contenu du blog b, pour obtenir le texte de l'article
3 Comment importer les articles + le contenu dans la base de données dans l'ordre
4 Le courant ? le problème est principalement que je ne sais pas comment combiner deux pages différentes

.
女神的闺蜜爱上我女神的闺蜜爱上我2765 Il y a quelques jours878

répondre à tous(1)je répondrai

  • 巴扎黑

    巴扎黑2017-06-12 09:27:36

    Vous pouvez utiliser request.meta pour stocker des informations supplémentaires, telles que

    
    def parse_x1(self, response):
        extra = {}
        ...
        req = scrapy.Request(url2)
        req.callback = self.parse_x2
        ...
        req.meta['extra'] = extra 
        yield req
     
    def parse_x2(self, response):
        item = {}
        extra = response.meta['extra']
        item.update(extra)
        ...
        
        yield item
    

    répondre
    0
  • Annulerrépondre