首頁 >後端開發 >Python教學 >python的爬蟲框架有哪些

python的爬蟲框架有哪些

爱喝马黛茶的安东尼原創: 2019-06-12 15:38:358565瀏覽

python的爬蟲框架有哪些

python的爬蟲框架有哪些？以下為大家介紹一個常用的python爬蟲的十大框架：

一、Scrapy

Scrapy框架是一套較成熟的Python爬蟲框架，是使用Python開發的快速、高層次的資訊爬取框架，可以有效率的爬取web頁面並提取出結構化資料。

Scrapy應用範圍很廣，爬蟲開發、資料探勘、資料監測、自動化測試等。

二、PySpider

是國人用python寫的一個強大的網路爬蟲框架。主要功能如下：

1、強大的WebUI，包含：腳本編輯器、任務監控器，專案管理器和結果檢視器；
2、多資料庫支持，包括：MySQL, MongoDB, Redis, SQLite, Elasticsearch; PostgreSQL with SQLAlchemy等；
3、使用RabbitMQ, Beanstalk, Redis 和Kombu作為訊息佇列；
4、支援任務優先權設定、定時任務、失敗後重試等;
5、支援分散式爬蟲

三、Crawley

高速爬取對應網站的內容，支援關聯式與非關聯式資料庫，資料可匯出為JSON、XML等

python的爬蟲框架有哪些

相關文章