Heim  >  Artikel  >  Backend-Entwicklung  >  Wie man Web Scrape durchführt

Wie man Web Scrape durchführt

Linda Hamilton
Linda HamiltonOriginal
2024-10-17 19:08:02278Durchsuche

How to Web Scrape

Web Scraping mit PHP

Frage:

Wie kann ich den Titel extrahieren, an Bild und Text oder Beschreibung von einer angegebenen URL ohne externe Bibliotheken in PHP?

Antwort:

Um diese Aufgabe zu vereinfachen, sollten Sie die Verwendung der Bibliothek simple_html_dom in Betracht ziehen. Das folgende Beispiel zeigt, wie Sie mit dieser Bibliothek den Titel und das erste Bild erhalten:

<code class="php">require 'simple_html_dom.php';

$html = file_get_html('http://www.google.com/');
$title = $html->find('title', 0);
$image = $html->find('img', 0);

echo $title->plaintext . "<br>\n";
echo $image->src;</code>

Wenn Sie externe Bibliotheken lieber meiden möchten, können Sie Daten mithilfe regulärer Ausdrücke extrahieren. Dieser Ansatz wird jedoch für HTML nicht empfohlen.

<code class="php">$data = file_get_contents('http://www.google.com/');

preg_match('/<title>([^<]+)<\/title>/i', $data, $matches);
$title = $matches[1];

preg_match('/<img[^>]*src=["\']([^\'"']+)["\'][^>]*>/i', $data, $matches);
$img = $matches[1];

echo $title . "<br>\n";
echo $img;</code>

Das obige ist der detaillierte Inhalt vonWie man Web Scrape durchführt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn