Heim > Artikel > Backend-Entwicklung > Wie man Web Scrape durchführt
Web Scraping mit PHP
Frage:
Wie kann ich den Titel extrahieren, an Bild und Text oder Beschreibung von einer angegebenen URL ohne externe Bibliotheken in PHP?
Antwort:
Um diese Aufgabe zu vereinfachen, sollten Sie die Verwendung der Bibliothek simple_html_dom in Betracht ziehen. Das folgende Beispiel zeigt, wie Sie mit dieser Bibliothek den Titel und das erste Bild erhalten:
<code class="php">require 'simple_html_dom.php'; $html = file_get_html('http://www.google.com/'); $title = $html->find('title', 0); $image = $html->find('img', 0); echo $title->plaintext . "<br>\n"; echo $image->src;</code>
Wenn Sie externe Bibliotheken lieber meiden möchten, können Sie Daten mithilfe regulärer Ausdrücke extrahieren. Dieser Ansatz wird jedoch für HTML nicht empfohlen.
<code class="php">$data = file_get_contents('http://www.google.com/'); preg_match('/<title>([^<]+)<\/title>/i', $data, $matches); $title = $matches[1]; preg_match('/<img[^>]*src=["\']([^\'"']+)["\'][^>]*>/i', $data, $matches); $img = $matches[1]; echo $title . "<br>\n"; echo $img;</code>
Das obige ist der detaillierte Inhalt vonWie man Web Scrape durchführt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!