Heim >Backend-Entwicklung >PHP-Tutorial >Wie kann ich HTML-Tags beim Extrahieren von Knoten mit PHPs DOMDocument beibehalten?

Wie kann ich HTML-Tags beim Extrahieren von Knoten mit PHPs DOMDocument beibehalten?

Linda Hamilton
Linda HamiltonOriginal
2024-12-08 03:44:09819Durchsuche

How Can I Preserve HTML Tags When Extracting Nodes Using PHP's DOMDocument?

Probleme beim Extrahieren von HTML-Knoten mit DOMDocument

Einführung

DOMDocument, eine PHP-Klasse, bietet einen praktischen Ansatz zum Parsen und Bearbeiten von HTML-Dokumenten. Beim Versuch, HTML-Tags beim Extrahieren von Inhalten beizubehalten, kann es jedoch zu Schwierigkeiten kommen. Dieser Artikel befasst sich mit dem zugrunde liegenden Konzept von DOM und schlägt Lösungen zur Bewältigung dieser Herausforderung vor.

DOM und Knoten verstehen

DOMDocument stellt HTML-Dokumente als hierarchische Knotenbäume dar. Jeder Knoten kann untergeordnete Knoten haben, die eine komplexe Struktur bilden. Es ist wichtig zu erkennen, dass HTML-Elemente zusammen mit ihren Attributen und Textinhalten alle als Knoten innerhalb eines DOM-Dokuments dargestellt werden.

Lösung des Tag-Erhaltungsproblems

Die bereitgestellten Der Code ruft den DIV-Knoten mit der ID „showContent“ erfolgreich ab. Es ruft jedoch nur den Textinhalt innerhalb des DIV ab, mit Ausnahme der HTML-Tags selbst. Dies liegt daran, dass der Code $tag->nodeValue verwendet, wodurch lediglich der Text und nicht die tatsächlichen Knoten extrahiert werden.

Lösung: Knoten durchqueren

Um HTML-Knoten beizubehalten, müssen Sie die untergeordneten Knoten Ihres Zielknotens durchlaufen. Der folgende Code veranschaulicht diesen Ansatz:

$dom = new DOMDocument();
@$dom->loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('.//div[@id="showContent"]');
foreach ($tags as $tag) {
    echo $dom->saveXML($tag);
    echo '<br>';
}

Abrufen spezifischer Informationen aus HTML

Wenn Sie bestimmte Informationen aus dem HTML-Dokument benötigen, z. B. Links aus der Tabelle, Sie können die XPath-Abfrage ändern, um die entsprechenden Knoten auszuwählen. Zum Beispiel:

foreach ($div->getElementsByTagName('a') as $link) {
    echo $dom->saveXML($link);
}

Zusätzliche Ressourcen

Weitere Unterstützung bei der Arbeit mit DOMDocument finden Sie in den folgenden Ressourcen:

  • [ DOMDokument Dokumentation](https://www.php.net/manual/en/class.domdocument.php)
  • [Fragen und Antworten zu DOMDocument in Stack Overflow](https://stackoverflow.com/search? q=Benutzer:208809 DOM)

Das obige ist der detaillierte Inhalt vonWie kann ich HTML-Tags beim Extrahieren von Knoten mit PHPs DOMDocument beibehalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn