Heim  >  Artikel  >  Backend-Entwicklung  >  So analysieren Sie HTML-DOM mit PHP und Simple HTML DOM Parser

So analysieren Sie HTML-DOM mit PHP und Simple HTML DOM Parser

WBOY
WBOYOriginal
2023-06-17 11:37:131863Durchsuche

HTML DOM (Document Object Model) ist eine einfache und intuitive Möglichkeit, Elemente, Knoten und Attribute in HTML-Dokumenten abzurufen und zu bearbeiten. PHP ist eine weit verbreitete Skriptsprache, mit der sich die Entwicklung von Webanwendungen gut umsetzen lässt. In diesem Artikel wird erläutert, wie Sie PHP und den Simple HTML DOM Parser für die HTML-DOM-Analyse verwenden.

  1. Simple HTML DOM Parser installieren und einführen
    Simple HTML DOM Parser ist eine kostenlose Open-Source-PHP-Bibliothek, die zum Parsen von HTML DOM verwendet werden kann. Es kann von der offiziellen Website heruntergeladen und auf folgende Weise in PHP-Skripte eingeführt werden:
require_once 'simple_html_dom.php';
  1. HTML-Dokumentinhalt abrufen
    Vor dem HTML-DOM-Parsen müssen wir den Inhalt des HTML-Dokuments aus der Quelldatei abrufen. Dies kann auf verschiedene Arten erreicht werden. Eine davon ist die Verwendung der Funktion file_get_contents von PHP, wie unten gezeigt:
$html = file_get_contents('example.html');

In diesem Beispiel speichern wir den Dokumentinhalt zur späteren Verwendung in der Variablen $html.

  1. Verwenden Sie den einfachen HTML-DOM-Parser für die DOM-Analyse.
    Mit dem einfachen HTML-DOM-Parser können wir ein HTML-DOM-Objekt auf folgende Weise instanziieren:
$html_dom = new simple_html_dom();

Als nächstes können wir die Ladefunktion verwenden, um den Inhalt des HTML-Dokuments an das zu übergeben HTML-DOM-Objekt, wie unten gezeigt:

$html_dom->load($html);

Jetzt können wir über verschiedene Funktionen und Eigenschaften des HTML-DOM-Objekts auf Elemente im HTML-Dokument zugreifen.

  1. HTML-Elemente abrufen
    Wir können die Suchfunktion verwenden, um Elemente im HTML-Dokument abzurufen, zum Beispiel:
$element = $html_dom->find('.example-class', 0);

In diesem Beispiel erhalten wir das Element mit dem Namen „example-class“ über den Klassennamen.

Wir können auch andere Selektoren wie ID und Tag-Name verwenden, um die Elemente im HTML-Dokument abzurufen. Zum Beispiel können wir ein Element mit der ID „example-id“ mithilfe des folgenden Codes abrufen:

$element = $html_dom->find('#example-id', 0);

Ebenso können wir das Element des H1-Tags abrufen, indem wir:

$element = $html_dom->find('h1', 0);
  1. Das Elementattribut abrufen
    Wir können es abrufen Verwenden der getAttribute-Funktion Attribute von HTML-Elementen, zum Beispiel:
$attr_value = $element->getAttribute('href');

In diesem Beispiel erhalten wir den Wert des Attributs mit dem Namen „href“.

  1. Textinhalt des Elements abrufen
    Wenn wir den Textinhalt des HTML-Elements abrufen möchten, können wir das Klartextattribut wie folgt verwenden:
$element_text = $element->plaintext;
  1. Schleife durch die HTML-Elemente
    Schließlich können wir foreach verwenden um das HTML-Dokument aller Elemente zu durchlaufen, wie unten gezeigt:
foreach ($html_dom->find('a') as $element) {
  $attr_value = $element->getAttribute('href');
  echo $attr_value;
}

In diesem Beispiel verwenden wir einen Selektor, um alle mit einem markierten Elemente zu finden, und verwenden eine foreach-Schleife, um über sie zu iterieren. Während der Schleife erhalten wir die href-Attributwerte aller Elemente und drucken sie aus.

Fazit
Durch die Verwendung von PHP und Simple HTML DOM Parser können wir problemlos HTML-DOM-Parsing implementieren sowie auf Elemente in HTML-Dokumenten zugreifen und diese bearbeiten. Ich hoffe, dieser Artikel hilft Ihnen!

Das obige ist der detaillierte Inhalt vonSo analysieren Sie HTML-DOM mit PHP und Simple HTML DOM Parser. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn