PHP-Bibliotheken

Andere Bibliotheken

PHP-Website-Crawling-Bibliothek

Andere Bibliotheken

Hol es dir jetzt

PHP-Website-Crawling-Bibliothek

<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

unterstützt das Crawlen und Crawlen von Websites. Es handelt sich um ein serverseitiges Open-Source-Projekt, das PHP-Entwicklern die einfache Verarbeitung von DOM-Dokumentinhalten ermöglicht, beispielsweise das Abrufen der Schlagzeileninformationen einer Nachrichtenwebsite. Interessanter ist, dass es die Idee von jQuery verwendet. Sie können den Seiteninhalt genauso verarbeiten, wie Sie jQuery verwenden, um die gewünschten Seiteninformationen zu erhalten.

Haftungsausschluss

Alle Ressourcen auf dieser Website werden von Internetnutzern bereitgestellt oder von großen Download-Sites nachgedruckt. Bitte überprüfen Sie selbst die Integrität der Software! Alle Ressourcen auf dieser Website dienen nur als Referenz zum Lernen. Bitte nutzen Sie diese nicht für kommerzielle Zwecke. Andernfalls sind Sie für alle Folgen verantwortlich! Wenn ein Verstoß vorliegt, kontaktieren Sie uns bitte, um ihn zu löschen. Kontaktinformationen: admin@php.cn

Verwandter Artikel

Auf der Suche nach einem PHP/Python-Bibliotheksverwaltungsprogramm (ähnlich der Baidu-Bibliothek, die Dokumente/PDFs und andere Bibliotheken verwaltet)

30Sep2016

Auf der Suche nach einem PHP/Python-Bibliotheksverwaltungsprogramm (ähnlich der Baidu-Bibliothek, die doc/pdf und andere Bibliotheken verwaltet) ~~ Es muss hauptsächlich über Suchfunktionen verfügen, insbesondere Funktionen zum Abrufen der Dateiklassifizierung/Datei-Tags, keine Online-Konvertierung erforderlich, online Stöbern!

Memcache vs. Memcached: Welche PHP-Bibliothek sollten Sie wählen?

09Nov2024

Unterscheidung zwischen „Memcache“ und „Memcached“ in PHPPHP bietet zwei Memcached-Bibliotheken: Memcache und Memcached. Das Verständnis ihrer Unterschiede hilft...

Memcache vs. Memcached: Welche PHP-Memcached-Bibliothek sollten Sie wählen?

19Nov2024

Memcache vs. Memcached: Auswahl der richtigen PHP-Memcached-BibliothekEinführungPHP bietet zwei scheinbar ähnliche Memcached-Bibliotheken: Memcache und...

Memcache vs. Memcached: Welche PHP-Caching-Bibliothek sollten Sie wählen?

12Nov2024

Memcache vs. Memcached: Auswahl der richtigen PHP-Bibliothek für Ihre Cache-AnforderungenIm Bereich der PHP-Caching-Bibliotheken stechen Memcache und Memcached hervor ...

Welche PHP-Bibliothek passt am besten zu Ihren Anforderungen an die Validierung von E-Mail-Adressen?

18Nov2024

PHP-Bibliotheken zur E-Mail-Adressvalidierung aufgedecktE-Mail-Adressvalidierung spielt eine entscheidende Rolle bei der Datenvalidierung, aber die Erstellung einer...