Maison >développement back-end >Tutoriel Python >Introduction aux outils de ligne de commande courants de Scrapy

Introduction aux outils de ligne de commande courants de Scrapy

零下一度
零下一度original
2017-06-28 15:55:041535parcourir

Afficher toutes les commandes

scrapy -h

Afficher les informations d'aide

scapy --help

Afficher les informations sur la version

(venv)ql@ql:~$ scrapy version
Scrapy 1.1.2(venv)ql@ql:~$ 
(venv)ql@ql:~$ scrapy version -vScrapy    : 1.1.2lxml      : 3.6.4.0libxml2   : 2.9.4Twisted   : 16.4.0Python    : 2.7.12 (default, Jul  1 2016, 15:12:24) - [GCC 5.4.0 20160609]pyOpenSSL : 16.1.0 (OpenSSL 1.0.2g-fips  1 Mar 2016)Platform  : Linux-4.4.0-36-generic-x86_64-with-Ubuntu-16.04-xenial
(venv)ql@ql:~$

Créer un nouveau projet

scrapy startproject spider_name

Build crawler genspider (generator spider)

Plusieurs araignées peuvent exister dans un projet, mais le nom doit être unique

scrapy genspider name domain# Par exemple : #scrapy genspider sohu sohu.org

Voir combien de robots d'exploration il y a dans le projet en cours

liste scrapy

voir Utiliser un navigateur pour ouvrir la page Web

vue scrapy www.baidu.com

commande shell, entrez dans l'environnement interactif scrpay

#Entrez l'environnement interactif de l'url scrapy shell www.dmoz.org/Computers/ Programming/Languages/Python/Books/

Entrez ensuite dans l'environnement interactif
Nous utilisons principalement la commande de réponse ici, par exemple, vous pouvez utiliser

response.xpath() #Brackets Ajoutez directement le chemin XPath

La commande runspider est utilisée pour exécuter directement le robot créé, et n'exécutera pas l'intégralité du projet

Nom du robot d'exploration Scrapy Runspider


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn