Heim  >  Artikel  >  Backend-Entwicklung  >  Wie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?

Wie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?

Linda Hamilton
Linda HamiltonOriginal
2024-10-31 13:14:20502Durchsuche

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

HTML mit PHPs DOMDocument und XPath analysieren

Beim Versuch, HTML mit PHPs DOMDocument zu analysieren, besteht ein häufiges Problem darin, bestimmten Text in Tags von zu finden bestimmte Klassen. Die alleinige Verwendung von DOMDocument::getElementsByTagName reicht in solchen Fällen möglicherweise nicht aus.

Um spezifischen Text innerhalb von Tags einer Zielklasse zu erfassen, wird ein alternativer Ansatz unter Verwendung von DOMDocument und DOMXPath empfohlen. DOMXPath ermöglicht leistungsstarke XPath-Abfragen zum Auffinden von Elementen basierend auf ihren Attributen und ihrer Struktur.

Beachten Sie den folgenden HTML-Code:

<div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div>

Um den Text innerhalb des

Tags mit class="text", die Nachkommen des
sind Tags mit class="main", folgen Sie diesen Schritten:

php
$html = <<loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}

Dieses Code-Snippet gibt Folgendes aus:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

Durch die Verwendung von DOMDocument und DOMXPath können Sie Elemente darin genau lokalisieren und abrufen eine HTML-Struktur, auch wenn es um spezifische Klassenhierarchien und Inhaltsanforderungen geht.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn