python - Scrapy如何得到原始的start_url

Question

Scrapy爬蟲時，由於重定向或是其他原因，會導致原始的start_url改變，怎樣才能得到原始的start_url? {程式碼...}

为情所困 · Answer

參考文章：Scrapy爬蟲常見問題摘要

利用Request中的meta參數傳遞訊息

def start_requests(self):
    start_url = 'your_scrapy_start_url'
    yield Request(start_url, self.parse, meta={'start_url':start_url})
    
def parse(self, response):
    item = YourItem()
    item['start_url'] = response.meta['start_url']
    yield item

python - Scrapy如何得到原始的start_url

全部回覆(1)我來回復