首頁  >  文章  >  後端開發  >  Scrapy常用命令列工具介紹

Scrapy常用命令列工具介紹

零下一度
零下一度原創
2017-06-28 15:55:041478瀏覽

查看所有指令

scrapy -h

查看幫助資訊

scapy --help

查看版本資訊

(venv)ql@ql:~$ scrapy version
Scrapy 1.1.2(venv)ql@ql:~$ 
(venv)ql@ql:~$ scrapy version -vScrapy    : 1.1.2lxml      : 3.6.4.0libxml2   : 2.9.4Twisted   : 16.4.0Python    : 2.7.12 (default, Jul  1 2016, 15:12:24) - [GCC 5.4.0 20160609]pyOpenSSL : 16.1.0 (OpenSSL 1.0.2g-fips  1 Mar 2016)Platform  : Linux-4.4.0-36-generic-x86_64-with-Ubuntu-16.04-xenial
(venv)ql@ql:~$

新建一個工程

scrapy startproject spider_name

建構爬蟲genspider(generator spider)

一個工程中可以存在多個spider, 但是名字必須唯一

scrapy genspider name domain#如:#scrapy genspider sohu sohu.org

查看目前專案內有多少爬蟲

scrapy list

view使用瀏覽器開啟網頁

scrapy view www.baidu.com

shell指令, 進入scrpay互動環境

##進入該url的互動環境scrapy shell www.dmoz.org/Computers/Programming/Languages/Python/ Books/

之後便進入互動環境
我們主要使用這裡面的response指令, 例如可以使用

response.xpath()    #括號裡直接加上xpath路徑

runspider指令用於直接執行建立的爬蟲, 並不會執行整個專案

scrapy runspider 爬蟲名稱


#

以上是Scrapy常用命令列工具介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn