Heim > Artikel > Backend-Entwicklung > Wie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?
HTML mit PHPs DOMDocument und XPath analysieren
Beim Versuch, HTML mit PHPs DOMDocument zu analysieren, besteht ein häufiges Problem darin, bestimmten Text in Tags von zu finden bestimmte Klassen. Die alleinige Verwendung von DOMDocument::getElementsByTagName reicht in solchen Fällen möglicherweise nicht aus.
Um spezifischen Text innerhalb von Tags einer Zielklasse zu erfassen, wird ein alternativer Ansatz unter Verwendung von DOMDocument und DOMXPath empfohlen. DOMXPath ermöglicht leistungsstarke XPath-Abfragen zum Auffinden von Elementen basierend auf ihren Attributen und ihrer Struktur.
Beachten Sie den folgenden HTML-Code:
<div class="main"> <div class="text"> Capture this text 1 </div> </div> <div class="main"> <div class="text"> Capture this text 2 </div> </div>
Um den Text innerhalb des
php $html = <<loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }
Dieses Code-Snippet gibt Folgendes aus:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
Durch die Verwendung von DOMDocument und DOMXPath können Sie Elemente darin genau lokalisieren und abrufen eine HTML-Struktur, auch wenn es um spezifische Klassenhierarchien und Inhaltsanforderungen geht.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!