QueryList3更新日誌


經過不斷的迭代,PHP採集利器QueryList迎來了QueryList3!

下面來看看QueryList3有何改變吧:
1.調整參數,不再相容以前版本
2.使用psr-4
3.使用composer
4.更改屬性名稱jsonArr為data
5.廢棄getJson方法
6.加入getData、getHtml、getInstance以及run方法
7.加入擴充功能,透過擴充功能可以實現多執行緒批量採集,模擬登陸採集等功能,讓QueryList變得無限可能。
8.改進還有諸如:進一步降低了亂碼出現的幾率、增強了內建的源碼抓取方法、實現無限級嵌套採集等。

現介紹已有的範例擴充:
   1.Request擴充,可以實現如攜帶cookie、偽造來路等任意複雜的網路請求,再也不用擔心QueryList內置的抓取功能太弱了。
   2.Login擴展,可以實現模擬登陸然後採集。
   3.Multi擴充,多執行緒(多進程)擷取擴充。
擴充透過QueryList::run 方法運行。

使用Composer安裝(當然也可以不使用這種方式):

#QueryList以及其依賴:
composer require jaeger/querylist

QueryList擴充功能需要選擇性的單獨安裝:

Request網路操作擴充功能:
composer require jaeger/querylist-ext-request

#Multi多執行緒擴充:
composer require jaeger/querylist-ext-multi

Login模擬登陸擴充:
composer require jaeger/querylist-ext-login

包含QueyListy以及擴充功能的完整配置如下:

{
    "require": {
        "jaeger/querylist": "^3.1",
        "jaeger/querylist-ext-request":"^1.0",
        "jaeger/querylist-ext-multi":"^1.0",
        "jaeger/querylist-ext-login":"^1.0"
    }
}

以下類別庫是上面擴充功能的依賴,安裝擴充功能的時候會自動安裝,也可以選擇單獨引入使用:

Http類別:
composer require jaeger/http

CurlMulti多執行緒類別:
composer require jaeger/curlmulti

#