python - Scrapy如何得到原始的start_url

Question

Scrapy爬虫时，由于重定向或是其他原因，会导致原始的start_url发生改变，怎样才能得到原始的start_url? {代码...}

为情所困 · Answer

参考文章：Scrapy爬虫常见问题总结

利用Request中的meta参数传递信息

def start_requests(self):
    start_url = 'your_scrapy_start_url'
    yield Request(start_url, self.parse, meta={'start_url':start_url})
    
def parse(self, response):
    item = YourItem()
    item['start_url'] = response.meta['start_url']
    yield item

python - Scrapy如何得到原始的start_url

全部回复(1)我来回复