Detaillierte Erläuterung der Prinzipien und Leistungsvergleich von vier XML-Parsern-XML/RSS-Tutorial-php.cn

Heim

Backend-Entwicklung

XML/RSS-Tutorial

Detaillierte Erläuterung der Prinzipien und Leistungsvergleich von vier XML-Parsern

黄舟

Mar 24, 2017 pm 04:39 PM

1: DOM

DOM ist der offizielle W3C-Standard für die plattform- und sprachunabhängige Darstellung von XML-Dokumenten. Das DOM ist eine Sammlung von Knoten oder Informationsstücken, die in einer hierarchischen Struktur organisiert sind. Diese Hierarchie ermöglicht es Entwicklern, den Baum nach bestimmten Informationen zu durchsuchen. Die Analyse dieser Struktur erfordert normalerweise das Laden des gesamten Dokuments und den Aufbau der Hierarchie, bevor Arbeiten ausgeführt werden können. Da es auf einer Informationshierarchie basiert, wird das DOM als baumbasiert oder objektbasiert betrachtet. DOM und die baumbasierte Verarbeitung im Allgemeinen haben mehrere Vorteile.
Erstens kann der Baum, da er im Speicher persistent ist, geändert werden, sodass die Anwendung Änderungen an den Daten und der Struktur vornehmen kann. Es ermöglicht außerdem jederzeit die Navigation im Baum nach oben und unten, anstatt einen einmaligen Vorgang wie bei SAX durchzuführen. DOM ist auch viel einfacher zu verwenden.
Andererseits kann das Parsen und Laden des gesamten Dokuments bei besonders großen Dokumenten langsam und ressourcenintensiv sein, daher ist es besser, andere Mittel zur Verarbeitung solcher Daten zu verwenden. Dabei handelt es sich um ereignisbasierte Modelle wie SAX.

2:SAX

Die Vorteile dieser Verarbeitung sind den Vorteilen von Streaming Media sehr ähnlich. Die Analyse kann sofort beginnen, anstatt auf die Verarbeitung aller Daten zu warten. Da die Anwendung die Daten lediglich beim Lesen überprüft, besteht außerdem keine Notwendigkeit, die Daten im Speicher zu speichern. Bei großen Dokumenten ist das ein großer Vorteil. Tatsächlich muss die Anwendung nicht einmal das gesamte Dokument analysieren; sie kann die Analyse stoppen, wenn eine bestimmte Bedingung erfüllt ist. Im Allgemeinen ist SAX auch viel schneller als sein Nachfolger DOM.
　3: DOM oder SAX wählen?
Für Entwickler, die ihren eigenen Code schreiben müssen, um XML-Dokumente zu verarbeiten, ist die Wahl des DOM- oder SAX-Parsing-Modells eine sehr wichtige Designentscheidung.
　DOM verwendet eine Baumstruktur für den Zugriff auf XML-Dokumente, während SAX ein Ereignismodell verwendet.
　Der DOM-Parser konvertiert ein XML-Dokument in einen Baum, der seinen Inhalt enthält, und kann den Baum durchlaufen. Der Vorteil der Verwendung von DOM zum Parsen des Modells besteht darin, dass die Programmierung einfach ist. Entwickler müssen lediglich die Anweisungen zur Baumerstellung aufrufen und dann mithilfe von Navigations-APIss auf die erforderlichen Baumknoten zugreifen, um die Aufgabe abzuschließen. Elemente im Baum können einfach hinzugefügt und geändert werden. Da bei der Verwendung des DOM-Parsers jedoch das gesamte XML-Dokument verarbeitet werden muss, ist der Leistungs- und Speicherbedarf insbesondere bei großen XML-Dateien relativ hoch. Aufgrund seiner Traversalfähigkeiten werden DOM-Parser häufig in Diensten verwendet, bei denen XML-Dokumente häufig geändert werden müssen.
Der SAX-Parser verwendet ein ereignisbasiertes Modell. Er kann beim Parsen von XML-Dokumenten eine Reihe von Ereignissen auslösen. Wenn ein bestimmtes Tag gefunden wird, kann er eine Rückrufmethode aktivieren, um der Methode mitzuteilen, dass das angegebene Tag angezeigt wurde . SAX hat im Allgemeinen einen geringeren Speicherbedarf, da Entwickler entscheiden können, welche Tags verarbeitet werden sollen. Insbesondere wenn Entwickler nur einen Teil der im Dokument enthaltenen Daten verarbeiten müssen, kommt die Skalierbarkeit von SAX besser zur Geltung. Bei Verwendung eines SAX-Parsers ist die Codierung jedoch schwieriger und es ist schwierig, gleichzeitig auf mehrere verschiedene Daten im selben Dokument zuzugreifen.

4:JDOM

JDOM soll ein Java-spezifisches Dokumentmodell sein, das die Interaktion mit XML vereinfacht und schneller ist als die Verwendung der DOM-Implementierung. JDOM wurde stark gefördert und gefördert, seit es das erste Java-spezifische Modell war. Es wird über eine eventuelle Verwendung als „Java Standard Extension“ über „Java Specification Request JSR-102“ nachgedacht. Die JDOM-Entwicklung ist seit Anfang der 2000er Jahre im Gange.
Es gibt zwei Hauptunterschiede zwischen JDOM und DOM. Erstens verwendet JDOM nur konkrete Klassen und keine Schnittstellen. Dies vereinfacht die API in gewisser Weise, schränkt aber auch die Flexibilität ein. Zweitens macht die API intensiven Gebrauch von Collections-Klassen, was die Nutzung für Java-Entwickler vereinfacht, die bereits mit diesen Klassen vertraut sind.
In der JDOM-Dokumentation heißt es, dass ihr Zweck darin besteht, „80 % (oder mehr) Java/XML-Probleme mit 20 % (oder weniger) Aufwand zu lösen“ (angenommen, 20 % basierend auf der Lernkurve). JDOM ist sicherlich für die meisten Java/XML-Anwendungen nützlich und die meisten Entwickler finden die API viel einfacher zu verstehen als das DOM. JDOM umfasst außerdem ziemlich umfassende Überprüfungen des Programmverhaltens, um zu verhindern, dass Benutzer etwas tun, das in XML keinen Sinn ergibt. Allerdings ist es immer noch erforderlich, dass Sie XML gut genug verstehen, um über die Grundlagen hinauszugehen (oder in manchen Fällen sogar Fehler zu verstehen). Dies ist möglicherweise eine sinnvollere Aufgabe als das Erlernen von DOM- oder JDOM-Schnittstellen.
JDOM selbst enthält keinen Parser. Es verwendet normalerweise einen SAX2-Parser, um XML-Eingabedokumente zu analysieren und zu validieren (obwohl es auch zuvor erstellte DOM-Darstellungen als Eingabe verwenden kann). Es enthält Konverter zur Ausgabe von JDOM-Darstellungen in SAX2-Ereignisströme, DOM-Modelle oder XML-Textdokumente. JDOM ist Open Source und wird unter einer Variante der Apache-Lizenz veröffentlicht.

5: DOM4J

Obwohl DOM4J eine völlig unabhängige Entwicklung darstellt, war es ursprünglich eine intelligente Abzweigung von JDOM. Es umfasst viele Funktionen, die über die grundlegende XML-Dokumentdarstellung hinausgehen, einschließlich integrierter XPath-Unterstützung, XML-Schema-Unterstützung und ereignisbasierter Verarbeitung für große oder Streaming-Dokumente. Es bietet außerdem Optionen zum Erstellen von Dokumentdarstellungen mit parallelen Zugriffsfunktionen über die DOM4J-API und Standard-DOM-Schnittstellen. Es befindet sich seit Ende 2000 in der Entwicklung.
Um all diese Funktionen zu unterstützen, verwendet DOM4J Schnittstellen und abstrakte Basisklassenmethoden. DOM4J nutzt die Collections-Klasse in der API intensiv, bietet aber in vielen Fällen auch Alternativen, die eine bessere Leistung oder einen einfacheren Codierungsansatz ermöglichen. Der direkte Vorteil besteht darin, dass DOM4J zwar den Preis einer komplexeren API zahlt, aber eine viel größere Flexibilität bietet als JDOM.
Während DOM4J mehr Flexibilität, XPath-Integration und die Handhabung großer Dokumente bietet, sind die Ziele dieselben wie bei JDOM: Benutzerfreundlichkeit und intuitive Bedienung für Java-Entwickler. Außerdem soll es eine umfassendere Lösung als JDOM sein und das Ziel erreichen, praktisch alle Java/XML-Probleme zu lösen. Es erreicht dieses Ziel, indem es weniger Wert als JDOM auf die Verhinderung fehlerhaften Anwendungsverhaltens legt.
DOM4J ist eine sehr, sehr hervorragende Java-XML-API mit hervorragender Leistung, leistungsstarken Funktionen und extremer Benutzerfreundlichkeit. Außerdem ist es eine Open-Source-Software. Heutzutage sieht man, dass immer mehr Java-Software DOM4J zum Lesen und Schreiben von XML verwendet. Besonders erwähnenswert ist, dass sogar Suns JAXM auch DOM4J verwendet.
　6: Übersicht
　JDOM und DOM zeigten beim Leistungstest eine schlechte Leistung und beim Testen von 10 Millionen Dokumenten lief der Speicher über. Bei kleinen Dokumenten lohnt es sich auch, über den Einsatz von DOM und JDOM nachzudenken. Obwohl die Entwickler von JDOM erklärt haben, dass sie sich voraussichtlich vor der offiziellen Veröffentlichung auf Leistungsprobleme konzentrieren werden, gibt es aus Leistungssicht wirklich nichts, was JDOM wirklich empfehlen würde. Darüber hinaus ist DOM immer noch eine sehr gute Wahl. Die DOM-Implementierung wird häufig in vielen Programmiersprachen verwendet. Es ist auch die Grundlage für viele andere XML-bezogene Standards und da es offiziell vom W3C empfohlen wird (im Gegensatz zum nicht standardbasierten Java-Modell), kann es auch in bestimmten Projekttypen erforderlich sein (z. B. in Javascript unter Verwendung von DOM).
SAX bietet eine bessere Leistung, was von der spezifischen Parsing-Methode abhängt. Ein SAX erkennt den eingehenden XML-Stream, lädt ihn jedoch nicht in den Speicher (natürlich werden einige Dokumente vorübergehend im Speicher ausgeblendet, wenn der XML-Stream gelesen wird).
Zweifellos ist DOM4J das Beste. Derzeit wird DOM4J häufig in vielen Open-Source-Projekten verwendet. Beispielsweise verwendet das berühmte Hibernate DOM4J auch zum Lesen von XML-Konfigurationsdateien. Wenn Portabilität kein Problem darstellt, verwenden Sie DOM4J!

Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Prinzipien und Leistungsvergleich von vier XML-Parsern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

RSS & XML: Verständnis des dynamischen Duos von WebinhaltenApr 19, 2025 am 12:03 AM

RSS und XML sind Tools für die Verwaltung von Webinhalten. RSS wird verwendet, um Inhalte zu veröffentlichen und zu abonnieren, und XML wird verwendet, um Daten zu speichern und zu übertragen. Sie arbeiten mit Content Publishing, Abonnements und Update Push. Beispiele für die Nutzung sind RSS Publishing -Blog -Beiträge und XML -Speicherbuchinformationen.

RSS -Dokumente: Die Grundlage der Web -SyndizierungApr 18, 2025 am 12:04 AM

RSS-Dokumente sind XML-basierte strukturierte Dateien, die zum Veröffentlichen und Abonnieren von häufig aktualisierten Inhalten verwendet werden. Zu den Hauptfunktionen gehören: 1) automatisierte Inhaltsaktualisierungen, 2) Inhaltsaggregation und 3) Verbesserung der Browsereffizienz. Durch RSSFeed können Benutzer die neuesten Informationen aus verschiedenen Quellen rechtzeitig abonnieren und abrufen.

Dekodierung von RSS: Die XML -Struktur von InhaltsfeedsApr 17, 2025 am 12:09 AM

Die XML -Struktur von RSS umfasst: 1. XML -Deklaration und RSS -Version, 2. Kanal (Kanal), 3. Artikel. Diese Teile bilden die Grundlage von RSS -Dateien, sodass Benutzer Inhaltsinformationen durch Parsen von XML -Daten erhalten und verarbeiten können.

Wie man XML-basierte RSS-Feeds analysiert und nutztApr 16, 2025 am 12:05 AM

RSSFeedSusexmltosyndicateContent; ParsingtheminvolvesLoadingxml, NavigatingitsStructure, andextractingData.ApplicationsincludeBuildingNewsaggregatorsandTrackingPodcastepisodes.

RSS -Dokumente: Wie sie Ihren Lieblingsinhalt liefernApr 15, 2025 am 12:01 AM

RSS -Dokumente arbeiten, indem sie Inhaltsaktualisierungen über XML -Dateien veröffentlichen, und Benutzer abonnieren und erhalten Benachrichtigungen über RSS -Leser. 1. Inhaltsverlag erstellt und aktualisiert RSS -Dokumente. 2. Der RSS -Leser zugreift regelmäßig XML -Dateien auf und analysiert. 3. Benutzer durchsuchen und lesen aktualisierte Inhalte. Beispiel für die Nutzung: Abonnieren Sie den RSS -Feed von TechCrunch und kopieren Sie einfach den Link zum RSS -Leser.

Bauen von Futtermitteln mit XML: Ein praktischer Anleitung zu RSSApr 14, 2025 am 12:17 AM

Die Schritte zum Erstellen eines RSSFeeds mit XML sind wie folgt: 1. Erstellen Sie das Stammelement und setzen Sie die Version; 2. Fügen Sie das Kanalelement und seine grundlegenden Informationen hinzu; 3. Fügen Sie das Eintragselement hinzu, einschließlich des Titels, des Links und der Beschreibung; 4. Konvertieren Sie die XML -Struktur in eine Zeichenfolge und geben Sie sie aus. Mit diesen Schritten können Sie eine gültige RSSFeed von Grund auf neu erstellen und seine Funktionalität verbessern, indem Sie zusätzliche Elemente wie Erscheinungsdatum und Autoreninformationen hinzufügen.

Erstellen von RSS-Dokumenten: Ein Schritt-für-Schritt-TutorialApr 13, 2025 am 12:10 AM

Die Schritte zum Erstellen eines RSS -Dokuments sind wie folgt: 1. Schreiben Sie im XML -Format mit dem Stammelement, einschließlich der Elemente. 2. Hinzufügen usw. Elemente, um Kanalinformationen zu beschreiben. 3. Fügen Sie Elemente hinzu, die jeweils einen Inhaltseintrag darstellen, einschließlich ,,,,,,,,,. 4. Fügen Sie optional Elemente hinzu, um den Inhalt zu bereichern. 5. Stellen Sie sicher, dass das XML -Format korrekt ist, verwenden Sie Online -Tools, um die Leistung zu optimieren und den Inhalt auf dem neuesten Stand zu halten.

Die Rolle von XML in RSS: Die Grundlage von syndizierten InhaltenApr 12, 2025 am 12:17 AM

Die Kernrolle von XML in RSS besteht darin, ein standardisiertes und flexibles Datenformat bereitzustellen. 1. Die Struktur- und Markup -Sprachmerkmale von XML machen es für den Datenaustausch und Speicher für den Daten. 2. RSS verwendet XML, um ein standardisiertes Format zu erstellen, um die Inhaltsfreigabe zu erleichtern. 3. Die Anwendung von XML in RSS enthält Elemente, die Futterinhalte wie Titel und Veröffentlichungsdatum definieren. 4. Vorteile umfassen Standardisierung und Skalierbarkeit sowie Herausforderungen umfassen dokumentausführende und strenge Syntaxanforderungen. 5. Zu den Best Practices gehört die Validierung der XML -Gültigkeit, die einfache Haltung, die Verwendung von CDATA und die regelmäßige Aktualisierung.

See all articles