Bibliothèques PHP

Autres bibliothèques

bibliothèque d'exploration de sites Web php

Autres bibliothèques

Obtenez le maintenant

bibliothèque d'exploration de sites Web php

<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

prend en charge l'exploration de sites Web et l'exploration. Il est très puissant. Il s'agit d'un projet open source côté serveur basé sur PHP. Il permet aux développeurs PHP de traiter facilement le contenu d'un document DOM, par exemple pour obtenir les informations principales d'un site Web d'actualités. Ce qui est plus intéressant, c'est qu'il utilise l'idée dejQuery. Vous pouvez traiter le contenu de la page comme si vous utilisiez jQuery pour obtenir les informations de page souhaitées.

Clause de non-responsabilité

Toutes les ressources de ce site proviennent d'internautes ou sont réimprimées par les principaux sites de téléchargement. Veuillez vérifier vous-même l'intégrité du logiciel ! Toutes les ressources de ce site sont uniquement à titre de référence d'apprentissage. Merci de ne pas les utiliser à des fins commerciales. Sinon, vous serez responsable de toutes les conséquences ! En cas d'infraction, veuillez nous contacter pour la supprimer. Coordonnées : admin@php.cn

Article connexe

Le robot d'exploration Python explore les sites Web de drames américains

27Feb2017

J'ai appris les robots d'exploration Python, alors aujourd'hui, j'ai écrit un robot sur un coup de tête pour récupérer tous les liens de drames américains sur le site Web et les enregistrer dans un document texte. Si vous voulez un drame, ouvrez-le simplement et copiez le lien vers Xunlei. téléchargez-le.

[Python] Web Crawler (5) : détails d'utilisation de urllib2 et des techniques d'exploration de sites Web

21Jan2017

J'ai mentionné une simple introduction à urllib2 plus tôt, et voici quelques détails sur la façon d'utiliser urllib2.

PHP: la fondation de nombreux sites Web

13Apr2025

Les raisons pour lesquelles PHP est la pile technologique préférée pour de nombreux sites Web incluent sa facilité d'utilisation, son soutien communautaire solide et son utilisation généralisée. 1) Facile à apprendre et à utiliser, adapté aux débutants. 2) Avoir une énorme communauté de développeurs et des ressources riches. 3) Largement utilisé dans WordPress, Drupal et d'autres plateformes. 4) Intégrez étroitement aux serveurs Web pour simplifier le déploiement du développement.

Comment créer un robot d'exploration Web de base en PHP ?

11Nov2024

Explorer avec PHPDans le paysage numérique actuel, la possibilité de récupérer et de stocker des données à partir de plusieurs pages Web est un atout précieux. Cet article...

Objectif de PHP: Construire des sites Web dynamiques

15Apr2025

PHP est utilisé pour créer des sites Web dynamiques, et ses fonctions principales incluent: 1. Générer du contenu dynamique et générer des pages Web en temps réel en se connectant à la base de données; 2. Traiter l'interaction utilisateur et les soumissions de formulaires, vérifier les entrées et répondre aux opérations; 3. Gérer les sessions et l'authentification des utilisateurs pour offrir une expérience personnalisée; 4. Optimiser les performances et suivre les meilleures pratiques pour améliorer l'efficacité et la sécurité du site Web.

Laravel et PHP: Création de sites Web dynamiques

18Apr2025

Utilisez Laravel et PHP pour créer des sites Web dynamiques efficacement et amusants. 1) Laravel suit l'architecture MVC, et le moteur du modèle de lame simplifie l'écriture HTML. 2) Le système de routage et le mécanisme de traitement des demandes facilitent la définition de l'URL et le traitement des entrées utilisateur. 3) Eloquentorm simplifie les opérations de base de données. 4) L'utilisation de la migration de la base de données, des opérations CRUD et des modèles de lame est démontrée par l'exemple du système de blog. 5) Laravel offre de puissantes fonctions d'authentification et d'autorisation des utilisateurs. 6) Les compétences de débogage comprennent l'utilisation de systèmes de journalisation et d'outils artisanaux. 7) Les suggestions d'optimisation des performances comprennent le chargement paresseux et la mise en cache.

See all articles