python - Scrapy ItemLoader如何选择返回结果list中的第二个以及以后的值？

Question

在items.py中加入： {代码...} 其他的不用改变，在spiders中的代码不需要改变 亟待解决：问题是第二个怎么选以及之后的几个？

大家讲道理 · Answer

Essayez d'ajouter une classe à scrapy.loader.processors.
J'ai trouvé la classe TakeFirst, puis j'ai ajouté

après

#第二个数据
class TakeSecond(object):

    def __call__(self, values):
        for i in range(len(values)):
            if i == 1 :
                if values[i] is not None and values[i] != '':
                    return values[i]

Ensuite, importez TakeSecond dans item.py et utilisez

    name = scrapy.Field(
        input_processor=MapCompose(remove_tags),
        output_processor=Join(),
    )
    price = scrapy.Field(
        input_processor=MapCompose(remove_tags, filter_price),
        output_processor=TakeSecond(),
    )

Ensuite, exécutez le résultat

>>> from scrapy.loader import ItemLoader
>>> from tutorial.items import Product
>>> il = ItemLoader(item=Product())
>>> il.add_value("price", ['333','444'])
>>> il.load_item()
{'price': u'444'}

迷茫 · Answer

à partir de scrapy.loader.processors importez TakeFirst

......
followees = Field(output_processor=Compose(lambda x: x[1:]))

python - Scrapy ItemLoader如何选择返回结果list中的第二个以及以后的值？

répondre à tous(2)je répondrai