보다 복잡한 http 네트워크 작업의 경우


QueryList의 내장 네트워크 작업은 매우 간단합니다. QueryList는 보다 복잡한 네트워크 작업을 위해 DOM 선택에 중점을 둡니다. 요청 확장을 사용하면 쿠키 전달, 원본 위조, 브라우저 위조 및 기타 기능을 쉽게 구현할 수 있지만 여전히 요구 사항을 충족할 수 없다고 생각되면 다음 몇 가지 해결 방법을 참조하세요. # 🎜🎜#

QueryList本身内置的网络操作非常简单,QueryList关注于DOM选择;对于更复杂的网络操作可以选择使用Request扩展,它可以简单的实现:携带cookie、伪造来路、伪造浏览器等功能,但如果觉的它依旧不能满足你的需求,下面有几个可以参考的方案:

1.自己用curl封装一个http请求

    例:

    function getHtml($url)
    {
                $ch = curl_init();
                curl_setopt($ch, CURLOPT_URL, $url);
                curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
                curl_setopt($ch, CURLOPT_AUTOREFERER, true);
                curl_setopt($ch, CURLOPT_REFERER, $url);
                curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
                $result = curl_exec($ch);
                curl_close($ch);
                return $result;
    }
    $rules = array(
    //采集规则
    );
    //获取页面源码
    $html = getHtml('http://xxx.com');
    //采集
    $data = QueryList::Query($html,$rules)->data;

    QueryList可以无缝与任意第三放http包配合使用,下面以guzzlehttp/guzzle包为例,Guzzle是一个PHP的HTTP客户端,用来轻而易举地发送请求,并集成到我们的WEB服务上。

    Guzzle1. 컬을 사용하여 http 요청을 직접 캡슐화

    #🎜 🎜#

    예:
    //安装QueryList
    composer require jaeger/querylist
    //安装Guzzle
    composer require guzzlehttp/guzzle
    QueryList는 모든 타사 http 패키지와 원활하게 사용할 수 있습니다. guzzlehttp /guzzle 패키지는 예입니다. Guzzle은 요청을 쉽게 보내는 데 사용되며 웹 서비스에 통합된 PHP HTTP 클라이언트입니다.
    Guzzle중국어 설명서: http://guzzle-cn.readthedocs.io/zh_CN/latest/

    #### ## ## #####설치####
    <?php
    require 'vendor/autoload.php';
    //实例化一个Http客户端
    $client = new GuzzleHttp\Client(['base_uri' => 'https://phphub.org']);
    $jar = new \GuzzleHttp\Cookie\CookieJar();
    //发送一个Http请求
    $response = $client->request('GET', '/categories/6', [
       'headers' => [
           'User-Agent' => 'testing/1.0',
           'Accept'     => 'application/json',
           'X-Foo'      => ['Bar', 'Baz']
       ],
       'form_params' => [
           'foo' => 'bar',
           'baz' => ['hi', 'there!']
       ],
       // 'cookies' => $jar,
       'timeout' => 3.14,
       // 'proxy' => 'tcp://localhost:8125',
       // 'cert' => ['/path/server.pem', 'password'],
    ]);
    $body = $response->getBody();
    //获取到页面源码
    $html = (string)$body;
    //采集规则
    $rules = array(
       //文章标题
       'title' => ['.media-heading a','text'],
       //文章链接
       'link' => ['.media-heading a','href'],
       //文章作者名
       'author' => ['.img-thumbnail','alt']
    );
    //列表选择器
    $rang = '.topic-list>li';
    //采集
    $data = \QL\QueryList::Query($html,$rules,$rang)->data;
    //查看采集结果
    print_r($data);
    #### ## ## ## ########
    Array
    (
        [0] => Array
            (
                [title] => 好友动态的实现原理
                [link] => https://phphub.org/topics/2750
                [author] => luo975974740
            )
        [1] => Array
            (
                [title] => 打造完美的 Ubuntu16.04 开发环境【持续更新】
                [link] => https://phphub.org/topics/2723
                [author] => liuwantao
            )
        //省略........
         [19] => Array
            (
                [title] => [Laravel 5.3 新功能] 10. 全文搜索方案 Laravel Scout 介绍
                [link] => https://phphub.org/topics/2673
                [author] => monkey
            )
    )
    #🎜 🎜#결과:
    rrreee