suchen
HeimPHP-BibliothekenAndere BibliothekenPHP-Website-Crawling-Bibliothek
PHP-Website-Crawling-Bibliothek
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);
unterstützt das Crawlen und Crawlen von Websites. Es handelt sich um ein serverseitiges Open-Source-Projekt, das PHP-Entwicklern die einfache Verarbeitung von DOM-Dokumentinhalten ermöglicht, beispielsweise das Abrufen der Schlagzeileninformationen einer Nachrichtenwebsite. Interessanter ist, dass es die Idee von jQuery verwendet. Sie können den Seiteninhalt genauso verarbeiten, wie Sie jQuery verwenden, um die gewünschten Seiteninformationen zu erhalten.

Haftungsausschluss

Alle Ressourcen auf dieser Website werden von Internetnutzern bereitgestellt oder von großen Download-Sites nachgedruckt. Bitte überprüfen Sie selbst die Integrität der Software! Alle Ressourcen auf dieser Website dienen nur als Referenz zum Lernen. Bitte nutzen Sie diese nicht für kommerzielle Zwecke. Andernfalls sind Sie für alle Folgen verantwortlich! Wenn ein Verstoß vorliegt, kontaktieren Sie uns bitte, um ihn zu löschen. Kontaktinformationen: admin@php.cn

Verwandter Artikel

Auf der Suche nach einem PHP/Python-Bibliotheksverwaltungsprogramm (ähnlich der Baidu-Bibliothek, die Dokumente/PDFs und andere Bibliotheken verwaltet)Auf der Suche nach einem PHP/Python-Bibliotheksverwaltungsprogramm (ähnlich der Baidu-Bibliothek, die Dokumente/PDFs und andere Bibliotheken verwaltet)

30Sep2016

Auf der Suche nach einem PHP/Python-Bibliotheksverwaltungsprogramm (ähnlich der Baidu-Bibliothek, die doc/pdf und andere Bibliotheken verwaltet) ~~ Es muss hauptsächlich über Suchfunktionen verfügen, insbesondere Funktionen zum Abrufen der Dateiklassifizierung/Datei-Tags, keine Online-Konvertierung erforderlich, online Stöbern!

So verwenden Sie PHP und Xunsearch, um die Buchsuchfunktion auf der Website der Bibliothek zu implementierenSo verwenden Sie PHP und Xunsearch, um die Buchsuchfunktion auf der Website der Bibliothek zu implementieren

31Jul2023

So verwenden Sie PHP und Xunsearch, um die Buchsuchfunktion von Bibliothekswebsites zu implementieren. In der modernen Gesellschaft spielen Bibliotheken als Wissenslager und Informationszentren eine wichtige Rolle im Prozess des Wissenserwerbs und Lernens. Um den Bedürfnissen der Leser besser gerecht zu werden, ist die Suchfunktion der Bibliothekswebsite besonders wichtig. In diesem Artikel wird erläutert, wie Sie mit PHP und Xunsearch die Buchsuchfunktion der Bibliothekswebsite implementieren. Xunsearch installieren und konfigurieren Zuerst müssen wir Xunsearch installieren und konfigurieren. Xuns

Lassen Sie uns darüber sprechen, wie Sie Open-Source-Bibliotheken von Drittanbietern verwenden, um die Website-Crawling-Funktion im Knoten zu implementierenLassen Sie uns darüber sprechen, wie Sie Open-Source-Bibliotheken von Drittanbietern verwenden, um die Website-Crawling-Funktion im Knoten zu implementieren

17Dec2021

In diesem Artikel erfahren Sie, wie Sie die Website-Crawling-Funktion mithilfe von Open-Source-Bibliotheken von Drittanbietern einfach implementieren können.

Wie führt man Daten-Crawling und Post-Crawling-Verarbeitung in PHP durch?Wie führt man Daten-Crawling und Post-Crawling-Verarbeitung in PHP durch?

20May2023

Mit der boomenden Entwicklung des Internets gewinnen Daten in unserem täglichen Leben und Arbeiten immer mehr an Bedeutung. Es gibt immer mehr Daten im Internet und es wird immer wichtiger, diese Daten zu beschaffen. Daher wird Data Scraping in der modernen Webanwendungsentwicklung immer beliebter. PHP ist eine der am weitesten verbreiteten serverseitigen Programmiersprachen, die auch zum Scrapen und Verarbeiten von Daten verwendet werden kann. In diesem Artikel erfahren Sie, wie Sie PHP für das Daten-Scraping und die Post-Crawling-Verarbeitung verwenden. Lassen Sie uns zunächst besprechen, wie Sie PHP zum Daten-Scraping verwenden. PHP bietet viele Bibliotheken

Integration der PHP-Funktionsbibliothek und der Bibliothek von DrittanbieternIntegration der PHP-Funktionsbibliothek und der Bibliothek von Drittanbietern

22Apr2024

Funktionsbibliotheken und Bibliotheken von Drittanbietern in PHP können die Funktionalität von Anwendungen erweitern. Die Funktionsbibliothek stellt vordefinierte Funktionen bereit, die über die Include-Anweisung eingebunden werden können. Bibliotheken von Drittanbietern sind aus Quellen wie Packagist und GitHub verfügbar und können mit Composer installiert werden. Implementieren Sie das automatische Laden von Klassen über einen Autoloader, z. B. das automatische Laden der Guzzle-Bibliothek. Erfahren Sie anhand praktischer Beispiele, wie Sie die Dompdf-Drittanbieterbibliothek zum Generieren von PDF-Dateien verwenden, einschließlich des Ladens der Bibliothek, des Ladens von HTML-Inhalten und der Ausgabe von PDF-Dateien. Die Integration von Funktionsbibliotheken und Bibliotheken von Drittanbietern erweitert die Funktionalität von PHP-Anwendungen erheblich und verbessert die Entwicklungseffizienz und Projektleistung.

Memcache vs. Memcached: Welche PHP-Bibliothek sollten Sie wählen?Memcache vs. Memcached: Welche PHP-Bibliothek sollten Sie wählen?

09Nov2024

Unterscheidung zwischen „Memcache“ und „Memcached“ in PHPPHP bietet zwei Memcached-Bibliotheken: Memcache und Memcached. Das Verständnis ihrer Unterschiede hilft...

See all articles