<?php header("Content-Type: text/html; charset=UTF-8"); require("phpQuery.php"); $hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text'))); //dump($hj->data); $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array( 'image' => array('img','src') ))->data; // $data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array( 'link' => array('a','href') ))->data; $page = 'http://cms.querylist.cc/news/566.html'; $reg = array( 'title' => array('h1','text'), 'date' => array('.pt_info','text','-span -a',function($content){ $arr = explode(' ',$content); return $arr[0]; }), 'content' => array('.post_content','html','a -.content_copyright -script',function($content){ $doc = phpQuery::newDocumentHTML($content); $imgs = pq($doc)->find('img'); foreach ($imgs as $img) { $src = 'http://cms.querylist.cc'.pq($img)->attr('src'); $localSrc = 'w/'.md5($src).'.jpg'; $stream = file_get_contents($src); file_put_contents($localSrc,$stream); pq($img)->attr('src',$localSrc); } return $doc->htmlOuter(); }) ); $rang = '.content'; $ql = QueryList::Query($page,$reg,$rang); $data = $ql->getData(); dump($data);unterstützt das Crawlen und Crawlen von Websites. Es handelt sich um ein serverseitiges Open-Source-Projekt, das PHP-Entwicklern die einfache Verarbeitung von DOM-Dokumentinhalten ermöglicht, beispielsweise das Abrufen der Schlagzeileninformationen einer Nachrichtenwebsite. Interessanter ist, dass es die Idee von jQuery verwendet. Sie können den Seiteninhalt genauso verarbeiten, wie Sie jQuery verwenden, um die gewünschten Seiteninformationen zu erhalten.
Alle Ressourcen auf dieser Website werden von Internetnutzern bereitgestellt oder von großen Download-Sites nachgedruckt. Bitte überprüfen Sie selbst die Integrität der Software! Alle Ressourcen auf dieser Website dienen nur als Referenz zum Lernen. Bitte nutzen Sie diese nicht für kommerzielle Zwecke. Andernfalls sind Sie für alle Folgen verantwortlich! Wenn ein Verstoß vorliegt, kontaktieren Sie uns bitte, um ihn zu löschen. Kontaktinformationen: admin@php.cn
Verwandter Artikel
30Sep2016
Auf der Suche nach einem PHP/Python-Bibliotheksverwaltungsprogramm (ähnlich der Baidu-Bibliothek, die doc/pdf und andere Bibliotheken verwaltet) ~~ Es muss hauptsächlich über Suchfunktionen verfügen, insbesondere Funktionen zum Abrufen der Dateiklassifizierung/Datei-Tags, keine Online-Konvertierung erforderlich, online Stöbern!
31Jul2023
So verwenden Sie PHP und Xunsearch, um die Buchsuchfunktion von Bibliothekswebsites zu implementieren. In der modernen Gesellschaft spielen Bibliotheken als Wissenslager und Informationszentren eine wichtige Rolle im Prozess des Wissenserwerbs und Lernens. Um den Bedürfnissen der Leser besser gerecht zu werden, ist die Suchfunktion der Bibliothekswebsite besonders wichtig. In diesem Artikel wird erläutert, wie Sie mit PHP und Xunsearch die Buchsuchfunktion der Bibliothekswebsite implementieren. Xunsearch installieren und konfigurieren Zuerst müssen wir Xunsearch installieren und konfigurieren. Xuns
17Dec2021
In diesem Artikel erfahren Sie, wie Sie die Website-Crawling-Funktion mithilfe von Open-Source-Bibliotheken von Drittanbietern einfach implementieren können.
20May2023
Mit der boomenden Entwicklung des Internets gewinnen Daten in unserem täglichen Leben und Arbeiten immer mehr an Bedeutung. Es gibt immer mehr Daten im Internet und es wird immer wichtiger, diese Daten zu beschaffen. Daher wird Data Scraping in der modernen Webanwendungsentwicklung immer beliebter. PHP ist eine der am weitesten verbreiteten serverseitigen Programmiersprachen, die auch zum Scrapen und Verarbeiten von Daten verwendet werden kann. In diesem Artikel erfahren Sie, wie Sie PHP für das Daten-Scraping und die Post-Crawling-Verarbeitung verwenden. Lassen Sie uns zunächst besprechen, wie Sie PHP zum Daten-Scraping verwenden. PHP bietet viele Bibliotheken
22Apr2024
Funktionsbibliotheken und Bibliotheken von Drittanbietern in PHP können die Funktionalität von Anwendungen erweitern. Die Funktionsbibliothek stellt vordefinierte Funktionen bereit, die über die Include-Anweisung eingebunden werden können. Bibliotheken von Drittanbietern sind aus Quellen wie Packagist und GitHub verfügbar und können mit Composer installiert werden. Implementieren Sie das automatische Laden von Klassen über einen Autoloader, z. B. das automatische Laden der Guzzle-Bibliothek. Erfahren Sie anhand praktischer Beispiele, wie Sie die Dompdf-Drittanbieterbibliothek zum Generieren von PDF-Dateien verwenden, einschließlich des Ladens der Bibliothek, des Ladens von HTML-Inhalten und der Ausgabe von PDF-Dateien. Die Integration von Funktionsbibliotheken und Bibliotheken von Drittanbietern erweitert die Funktionalität von PHP-Anwendungen erheblich und verbessert die Entwicklungseffizienz und Projektleistung.
09Nov2024
Unterscheidung zwischen „Memcache“ und „Memcached“ in PHPPHP bietet zwei Memcached-Bibliotheken: Memcache und Memcached. Das Verständnis ihrer Unterschiede hilft...
Hot Tools
PHP-Bibliothek für Abhängigkeitsinjektionscontainer
PHP-Bibliothek für Abhängigkeitsinjektionscontainer
Eine Sammlung von 50 hervorragenden klassischen PHP-Algorithmen
Klassischer PHP-Algorithmus, lernen Sie hervorragende Ideen und erweitern Sie Ihr Denken
Kleine PHP-Bibliothek zur Optimierung von Bildern
Kleine PHP-Bibliothek zur Optimierung von Bildern