QueryList3更新日誌
經過不斷的迭代,PHP採集利器QueryList迎來了QueryList3!
下面來看看QueryList3有何改變吧:
1.調整參數,不再相容以前版本
2.使用psr-4
3.使用composer
4.更改屬性名稱jsonArr為data
5.廢棄getJson方法
6.加入getData、getHtml、getInstance以及run方法
7.加入擴充功能,透過擴充功能可以實現多執行緒批量採集,模擬登陸採集等功能,讓QueryList變得無限可能。
8.改進還有諸如:進一步降低了亂碼出現的幾率、增強了內建的源碼抓取方法、實現無限級嵌套採集等。
現介紹已有的範例擴充:
1.Request擴充,可以實現如攜帶cookie、偽造來路等任意複雜的網路請求,再也不用擔心QueryList內置的抓取功能太弱了。
2.Login擴展,可以實現模擬登陸然後採集。
3.Multi擴充,多執行緒(多進程)擷取擴充。
擴充透過QueryList::run 方法運行。
使用Composer安裝(當然也可以不使用這種方式):
#QueryList以及其依賴:composer require jaeger/querylist
QueryList擴充功能需要選擇性的單獨安裝:
Request網路操作擴充功能:composer require jaeger/querylist-ext-request
#Multi多執行緒擴充:composer require jaeger/querylist-ext-multi
Login模擬登陸擴充:composer require jaeger/querylist-ext-login
包含QueyListy以及擴充功能的完整配置如下:
{ "require": { "jaeger/querylist": "^3.1", "jaeger/querylist-ext-request":"^1.0", "jaeger/querylist-ext-multi":"^1.0", "jaeger/querylist-ext-login":"^1.0" } }
以下類別庫是上面擴充功能的依賴,安裝擴充功能的時候會自動安裝,也可以選擇單獨引入使用:
Http類別:composer require jaeger/http
CurlMulti多執行緒類別:composer require jaeger/curlmulti