Heim > Fragen und Antworten > Hauptteil
Manchmal werden Informationen über Pyspider direkt an die nächste Funktion weitergeleitet, es ist jedoch nicht erforderlich, eine neue URL zu erstellen.
Zum Beispiel muss ein bestimmter Teil der Informationen auf einer Listenseite an die nächste Funktion übergeben werden, Sie möchten ihn jedoch nicht über die URL der Liste übergeben.
Ich habe darüber nachgedacht, die Methode send_message zu verwenden und auch Response.save von self.crawl (schreiben Sie die URL einer Website, die einfacher zu crawlen ist)
Aber keine dieser beiden Methoden ist besonders gut.
Gibt es eine gute Methode?
曾经蜡笔没有小新2017-05-18 11:02:39
无非跳转callback, 已出来的数据yield, 不过你还是测试一下.
def detail(self, response):
next_urls = [i.attr.href for i in response.doc('#fetch urls')]
for url in next_urls:
self.crawl(url, callback=self.list_page)
for i in items = [
# some result
]
yield i