首頁  >  問答  >  主體

Scrapy:使用自訂列設定儲存為 CSV 的指南

所以基本上我正在從網路上抓取數據,並且我有一個專案文件導入到我的主蜘蛛文件中。現在,當我抓取資料並將其儲存在容器中並將其另存為 csv 時,連結列最終總是成為 csv 中的第一列。如何設定自訂列的位置?

pName = response.css('#search .a-size-medium').css('::text').extract()
        pPrice = response.css('#search .a-price-whole').css('::text').extract()
        imgs = response.css('.sbv-product-img , .s-image-fixed-height .s-image').css('::attr(src)').extract()

        for prod in zip(pName , pPrice , imgs):        
            items['prodName'] = prod[0]     
            items['price'] = prod[1]        
            items['imgLink'] = prod[2]      
            
            yield items

P粉576184933P粉576184933220 天前370

全部回覆(1)我來回復

  • P粉391677921

    P粉3916779212024-04-05 10:51:21

    使用 settings.py 檔案或蜘蛛 custom_settings 屬性中的 FEED_EXPORT_FIELDS 設定。這些列將按照您在設定值中設定的順序排列。

    例如:

    class MySpider(scrapy.Spider):
    
        custom_settings = {
            "FEED_EXPORT_FIELDS": ["prodName", "price", "imgLink"]
        }
    

    或在settings.py中:

    FEED_EXPORT_FIELDS=["prodName", "price", "imgLink"]
    

    scrapy 文件連結link2

    回覆
    0
  • 取消回覆