Demander une extension d'exploitation du réseau



Extension de requête d'opération de réseau

Extension de requête, qui peut implémenter toutes les requêtes réseau complexes telles que le transport de cookies, la falsification d'origines, la falsification de navigateurs, etc.

Installation :

composer require jaeger/querylist-ext-request

Adresse GIT :

https://github.com/jae-jae/QueryList-Ext-Request.git

Dépendances (veuillez ignorer celles installées via Composer)

L'extension de requête dépend de la classe Http, l'adresse Git est : https://github.com/jae-jae/ Http.git< /code>Http类,Git地址为:https://github.com/jae-jae/Http.git

手动安装插件教程:http://doc.querylist.cc/site/index/doc/7

Tutoriel d'installation manuelle : http://doc.querylist.cc/site/index/doc/7

Utilisation un

$ql = QueryList::run('Request',[
    'http' => [
        'target' => '采集的目标页面',
        'referrer' => '来源地址',
        'method' => '请求方式,GET、POST等',
        'params' => ['提交的参数'=>'参数值','key'=>'value'],
        //等等其它http相关参数,具体可查看Http类源码
    ],
    'callback' => function($html,$args){
        //处理html的回调方法
        return $html;
    },
    'args' => '传给回调函数的参数'
]);
$data = $ql->setQuery(...)->data;

Utilisation deux

$ql = QueryList::run('Request',[
    'target' => '采集的目标页面',
    'referrer' => '来源地址',
    'method' => '请求方式,GET、POST等',
    'params' => ['提交的参数'=>'参数值','key'=>'value'],
    //等等其它http相关参数,具体可查看Http类源码
]);
$data = $ql->setQuery(...)->data;

La valeur de retour est l'objet QueryList avec l'attribut html défini, puis la méthode setQuery de QueryList doit être appelée pour définir les règles de collection.

🎜
//HTTP操作扩展
$urls = QueryList::run('Request',[
        'target' => 'http://cms.querylist.cc/news/list_2.html',
        'referrer'=>'http://cms.querylist.cc',
        'method' => 'GET',
        'params' => ['var1' => 'testvalue', 'var2' => 'somevalue'],
        'user_agent'=>'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0',
        'cookiePath' => './cookie.txt',
        'timeout' =>'30'
    ])->setQuery(['link' => ['h2>a','href','',function($content){
    //利用回调函数补全相对链接
    $baseUrl = 'http://cms.querylist.cc';
    return $baseUrl.$content;
}]],'.cate_list li')->getData(function($item){
    return $item['link'];
});