搜索
首页每日编程PHP知识PHP采集插件QueryList实践教学(一)

一: 需求背景

作为一个开发人员,在日常开发中或多或少多会遇到采集的需求,需要采集某个网站的数据、文章等等,同时在还需要对采集到内容进行解析,分类等操作。在解析分类的过程中,大多数PHPer使用正则的方式来分析爬到的数据,增加了难度的同时效率也没有得到提升,用QueryList则可以很简单的结果问题。

二:什么是QueryList?

QueryList是一个基于phpQuery的开源项目,可以让PHPer在采集信息时对内容进行一个类似JQuery的DOM操作,十分简洁方便,贴合平常开发的习惯。

三:下载安装

(1) 环境要求,安装方式有两种,选中以下任意一种都可以。

PHP >= 5.3

(2)  安装方式-使用composer安装

composer require jaeger/querylist:V3.2.1

或者在项目的composer.json文件中加入以下配置,之后composer update

"require" : {
  "jaeger/querylist": "^3.2"
}

安装完成之后在项目中,直接引入vendor/autoload.php文件,即可直接开始使用

(3) 测试

$html = <<<STR
<div id="one">
    <div class="two">
        <a href="http://querylist.cc">QueryList官网</a>
        <img src="http://querylist.com/1.jpg" alt="这是图片">
        <img src="http://querylist.com/2.jpg" alt="这是图片2">
    </div>
    <span>其它的<b>一些</b>文本</span>
</div>        
STR;
        $rules = array(
            //采集id为one这个元素里面的纯文本内容
            &#39;text&#39; => array(&#39;#one&#39;,&#39;text&#39;),
            //采集class为two下面的超链接的链接
            &#39;link&#39; => array(&#39;.two>a&#39;,&#39;href&#39;),
            //采集class为two下面的第二张图片的链接
            &#39;img&#39; => array(&#39;.two>img:eq(1)&#39;,&#39;src&#39;),
            //采集span标签中的HTML内容
            &#39;other&#39; => array(&#39;span&#39;,&#39;html&#39;)
        );

        $data = QueryList::Query($html, $rules)->data;
        var_dump($data);

(4) 安装方式-手动安装

前往Github下载代码https://github.com/jae-jae/QueryL,获取其中的QueryList.php和phpQuery.php这两个文件放到项目中即可

(5) 测试

<?php
require &#39;phpQuery.php&#39;;
require &#39;QueryList.php&#39;;

use QL\QueryList;

$hj = QueryList::Query(&#39;https://php.cn/&#39;,array("url"=>array(&#39;.unit h1 a&#39;,&#39;href&#39;)));

$data = $hj->getData(function($x){
    return $x[&#39;url&#39;];
});

print_r($data);

总结,这个插件下载安装还是很简单的,下期为大家介绍简单的采集文章内容,适合初学者学习,欢迎大家关注,及时收到新课程提醒。

以上是PHP采集插件QueryList实践教学(一)的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器