Maison  >  Article  >  programmation quotidienne  >  Enseignement pratique du plug-in de collection PHP QueryList (1)

Enseignement pratique du plug-in de collection PHP QueryList (1)

安安杰尼
安安杰尼original
2020-04-28 18:06:20198121parcourir

1 : Contexte de la demande

En tant que développeur, vous rencontrerez plus ou moins le besoin de collecter des données, des articles, etc. à partir d'un certain site Web dans le cadre du développement quotidien, etc. en même temps, il est également nécessaire d’analyser et de classer les contenus collectés. Dans le processus d'analyse et de classification, la plupart des PHPers utilisent des méthodes régulières pour analyser les données analysées, ce qui augmente la difficulté et n'améliore pas l'efficacité. QueryList peut résoudre le problème des résultats très facilement.

2 : Qu'est-ce que QueryList ?

QueryList est un projet open source basé sur phpQuery, qui permet à PHPer d'effectuer une opération DOM de type JQuery sur le contenu lors de la collecte d'informations. C'est très simple et pratique, et s'adapte aux habitudes de développement quotidiennes. .

3 : Téléchargez et installez

(1) Exigences environnementales, il existe deux méthodes d'installation, vous pouvez choisir l'une des suivantes.

PHP >= 5.3

(2) Méthode d'installation - Utilisez composer pour installer

composer require jaeger/querylist:V3.2.1

ou ajoutez la configuration suivante au fichier composer.json du projet, puis composer update

"require" : {
  "jaeger/querylist": "^3.2"
}

Une fois l'installation terminée, dans le projet, introduisez directement le fichier supplier/autoload.php et commencez à l'utiliser directement

(3) Test

$html = <<<STR
<div id="one">
    <div class="two">
        <a href="http://querylist.cc">QueryList官网</a>
        <img src="http://querylist.com/1.jpg" alt="这是图片">
        <img src="http://querylist.com/2.jpg" alt="这是图片2">
    </div>
    <span>其它的<b>一些</b>文本</span>
</div>        
STR;
        $rules = array(
            //采集id为one这个元素里面的纯文本内容
            &#39;text&#39; => array(&#39;#one&#39;,&#39;text&#39;),
            //采集class为two下面的超链接的链接
            &#39;link&#39; => array(&#39;.two>a&#39;,&#39;href&#39;),
            //采集class为two下面的第二张图片的链接
            &#39;img&#39; => array(&#39;.two>img:eq(1)&#39;,&#39;src&#39;),
            //采集span标签中的HTML内容
            &#39;other&#39; => array(&#39;span&#39;,&#39;html&#39;)
        );

        $data = QueryList::Query($html, $rules)->data;
        var_dump($data);

(4) Méthode d'installation-installation manuelle

Allez sur Github Téléchargez le code https://github.com/jae-jae/QueryL, récupérez les deux fichiers QueryList.php et phpQuery.php et mettez-les dans le projet

(5 ) Test

<?php
require &#39;phpQuery.php&#39;;
require &#39;QueryList.php&#39;;

use QL\QueryList;

$hj = QueryList::Query(&#39;https://php.cn/&#39;,array("url"=>array(&#39;.unit h1 a&#39;,&#39;href&#39;)));

$data = $hj->getData(function($x){
    return $x[&#39;url&#39;];
});

print_r($data);

En résumé, le téléchargement et l'installation de ce plug-in sont très simples. Dans le prochain numéro, je présenterai une collection simple de contenu d'articles, qui convient aux débutants. Tout le monde est invité à payer. attention et recevez de nouveaux rappels de cours à temps.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Comment fonctionne la séanceArticle suivant:Comment fonctionne la séance