Heim >Backend-Entwicklung >PHP-Tutorial >Wie kann ich mithilfe von Parsing-Techniken die Quell-URL des ersten Bilds aus einem HTML-Dokument extrahieren?

Wie kann ich mithilfe von Parsing-Techniken die Quell-URL des ersten Bilds aus einem HTML-Dokument extrahieren?

DDD
DDDOriginal
2024-12-28 19:40:11786Durchsuche

How Can I Extract the Source URL of the First Image from an HTML Document Using Parsing Techniques?

Abrufen von Quell-URLs von HTML-Bild-Tags mithilfe von Parsing-Techniken

Abrufen dynamischer Inhalte, z. B. der Quell-URL für das erste darin vorkommende Bild-Tag B. eines HTML-Dokuments, ist eine häufige Aufgabe in der Webentwicklung. Um dies zu erreichen, kommen HTML-Parsing-Techniken wie DOMDocument und DOMXpath ins Spiel.

DOMDocument und DOMXpath

DOMDocument stellt ein HTML-Dokument als Baumstruktur dar und ermöglicht den Zugriff darauf Elemente und Attribute. DOMXpath bietet eine effiziente Möglichkeit, diesen Baum zu durchqueren und bestimmte Werte zu extrahieren.

Lösung mit DOMDocument und DOMXpath

  • Laden Sie das HTML-Dokument in ein DOMDocument-Objekt.
  • Erstellen Sie ein DOMXPath-Objekt, das dem zugeordnet ist DOMDocument.
  • Verwenden Sie einen XPath-Ausdruck, um die Quell-URL des ersten Bild-Tags (//img/@src) abzurufen.
  • Weisen Sie die abgerufene URL einem zu Variable.

Beispiel

$html = '<img border="0" src="/images/image.jpg" alt="Image" width="100" height="100" />';

$doc = new DOMDocument();
$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$src = $xpath->evaluate("string(//img/@src)");

Quelle des ersten Bildes abrufen

Um sicherzustellen, dass nur die Quelle Um die URL des ersten Bildes abzurufen, verwenden Sie den XPath-Ausdruck string(//img/@src). Dieser Ausdruck gibt die Quell-URL als Zeichenfolge zurück.

Einzeilige Lösung

Für eine kompaktere Lösung können Sie den folgenden Einzeiler verwenden:

$src = (string) reset(simplexml_import_dom(DOMDocument::loadHTML($html))->xpath("//img/@src"));

Das obige ist der detaillierte Inhalt vonWie kann ich mithilfe von Parsing-Techniken die Quell-URL des ersten Bilds aus einem HTML-Dokument extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn