Heim  >  Artikel  >  Java  >  Detaillierte Einführung in den Vergleich von Codebeispielen für vier Möglichkeiten, XML in Java zu betreiben

Detaillierte Einführung in den Vergleich von Codebeispielen für vier Möglichkeiten, XML in Java zu betreiben

黄舟
黄舟Original
2017-03-21 10:52:311263Durchsuche

In diesem Artikel werden hauptsächlich vier Möglichkeiten zur Bedienung von xml in Java vorgestellt und verglichen und analysiert. Hat einen sehr guten Referenzwert. Werfen wir einen Blick darauf mit dem Editor unten

1) DOM (JAXP Crimson Parser)

DOM stellt XML-Dokumente auf plattform- und sprachunabhängige Weise dar. Offiziell W3C-Standard. DOM ist eine Sammlung von Knoten oder Informationsstücken, die in einer hierarchischen Struktur organisiert sind. Diese Hierarchie ermöglicht Entwicklern die Suche nach bestimmten Informationen in der Baumstruktur. Die Analyse dieser Struktur erfordert normalerweise das Laden des gesamten Dokuments und den Aufbau der Hierarchie, bevor Arbeiten ausgeführt werden können. Da DOM auf einer Informationshierarchie basiert, wird es als baumbasiert oder objektbasiert betrachtet. DOM und die baumbasierte Verarbeitung im Allgemeinen haben mehrere Vorteile. Da der Baum im Speicher persistent ist, kann er erstens so geändert werden, dass die Anwendung Änderungen an den Daten und Strukturen vornehmen kann. Es ermöglicht außerdem jederzeit die Navigation im Baum nach oben und unten, anstatt einen einmaligen Vorgang wie bei SAX durchzuführen. DOM ist auch viel einfacher zu verwenden.

2) SAX

Die Vorteile der SAX-Verarbeitung sind den Vorteilen von Streaming Media sehr ähnlich. Die Analyse kann sofort beginnen, anstatt auf die Verarbeitung aller Daten zu warten. Da die Anwendung die Daten lediglich beim Lesen überprüft, besteht außerdem keine Notwendigkeit, die Daten im Speicher zu speichern. Bei großen Dokumenten ist das ein großer Vorteil. Tatsächlich muss die Anwendung nicht einmal das gesamte Dokument analysieren; sie kann die Analyse stoppen, wenn eine bestimmte Bedingung erfüllt ist. Im Allgemeinen ist SAX auch viel schneller als sein Nachfolger DOM.

DOM oder SAX? Für Entwickler, die ihren eigenen Code schreiben müssen, um XML-Dokumente zu verarbeiten, ist die Wahl des DOM- oder SAX-Parsing-Modells eine sehr wichtige Designentscheidung. DOM verwendet eine Baumstruktur für den Zugriff auf XML-Dokumente, während SAX ein Ereignismodell verwendet.

Der DOM-Parser konvertiert das XML-Dokument in einen Baum, der seinen Inhalt enthält, und kann den Baum durchlaufen. Der Vorteil der Verwendung von DOM zum Parsen des Modells besteht darin, dass es einfach zu programmieren ist. Entwickler müssen lediglich die Anweisungen zum Erstellen des Baums aufrufen und dann mithilfe von Navigations-APIss auf die erforderlichen Baumknoten zugreifen, um die Aufgabe abzuschließen . Elemente im Baum können einfach hinzugefügt und geändert werden. Da bei der Verwendung des DOM-Parsers jedoch das gesamte XML-Dokument verarbeitet werden muss, ist der Leistungs- und Speicherbedarf insbesondere bei großen XML-Dateien relativ hoch. Aufgrund seiner Traversalfähigkeiten werden DOM-Parser häufig in Diensten verwendet, bei denen XML-Dokumente häufig geändert werden müssen.

Der SAX-Parser verwendet ein ereignisbasiertes Modell. Er kann beim Parsen von XML-Dokumenten eine Reihe von Ereignissen auslösen. Wenn ein bestimmtes Tag gefunden wird, kann er eine Rückrufmethode aktivieren und die Methode anweisen, das Tag zu formulieren gefunden worden. SAX hat in der Regel einen geringeren Speicherbedarf, da es Entwicklern ermöglicht, zu entscheiden, welche Tags verarbeitet werden sollen. Insbesondere wenn Entwickler nur einen Teil der im Dokument enthaltenen Daten verarbeiten müssen, spiegelt sich die Skalierbarkeit von SAX besser wider. Bei Verwendung eines SAX-Parsers ist die Codierung jedoch schwieriger und es ist schwierig, gleichzeitig auf mehrere verschiedene Daten im selben Dokument zuzugreifen.

3) JDOM

JDOM ist als Java-spezifisches Dokumentmodell konzipiert, das die Interaktion mit XML vereinfacht und schneller ist als die Verwendung der DOM-Implementierung. JDOM wurde stark gefördert und gefördert, seit es das erste Java-spezifische Modell war. Es wird über eine eventuelle Verwendung als „Java Standard Extension“ über „Java Specification Request JSR-102“ nachgedacht. Mit der JDOM-Entwicklung wurde seit Anfang der 2000er Jahre begonnen.

JDOM und DOM unterscheiden sich hauptsächlich in zwei Aspekten. Erstens verwendet JDOM nur konkrete Klassen und keine Schnittstellen. Dies vereinfacht die API in gewisser Weise, schränkt aber auch die Flexibilität ein. Zweitens nutzt die API umfassend die Collections-Klasse und vereinfacht so deren Verwendung für Java-Entwickler, die bereits mit diesen Klassen vertraut sind.

In der JDOM-Dokumentation heißt es, dass ihr Zweck darin besteht, „80 % (oder mehr) Java/XML-Probleme mit 20 % (oder weniger) Aufwand zu lösen“ (angenommen, 20 % basierend auf der Lernkurve). JDOM ist sicherlich für die meisten Java/XML-Anwendungen nützlich und die meisten Entwickler finden die API viel einfacher zu verstehen als DOM. JDOM umfasst außerdem ziemlich umfassende Überprüfungen des Programmverhaltens, um zu verhindern, dass Benutzer etwas tun, das in XML keinen Sinn ergibt. Allerdings ist es immer noch erforderlich, dass Sie XML gut genug verstehen, um über die Grundlagen hinauszugehen (oder in manchen Fällen sogar die Fehler zu verstehen). Dies ist möglicherweise eine sinnvollere Arbeit als das Erlernen von DOM- oder JDOM-Schnittstellen.

JDOM selbst enthält keinen Parser. Es verwendet normalerweise einen SAX2-Parser, um XML-Eingabedokumente zu analysieren und zu validieren (obwohl es auch zuvor erstellte DOM-Darstellungen als Eingabe verwenden kann). Es enthält Konverter zur Ausgabe von JDOM-Darstellungen in SAX2-Ereignisströme, DOM-Modelle oder XML-Textdokumente. JDOM ist Open Source und wird unter einer Variante der Apache-Lizenz veröffentlicht.

4) DOM4J

Obwohl DOM4J ein völlig unabhängiges Entwicklungsergebnis darstellt, war es zunächst eine intelligente Abzweigung von JDOM. Es umfasst viele Funktionen, die über die grundlegende XML-Dokumentdarstellung hinausgehen, einschließlich integrierter XPath-Unterstützung, XML-Schema-Unterstützung und ereignisbasierter Verarbeitung für große oder Streaming-Dokumente. Es bietet außerdem Optionen zum Erstellen von Dokumentdarstellungen mit parallelen Zugriffsfunktionen über die DOM4J-API und Standard-DOM-Schnittstellen. Es befindet sich seit der zweiten Hälfte des Jahres 2000 in der Entwicklung.

Um all diese Funktionen zu unterstützen, verwendet DOM4J Schnittstellen und abstrakte Basisklassenmethoden. DOM4J nutzt die Collections-Klasse in der API intensiv, bietet aber in vielen Fällen auch Alternativen, die eine bessere Leistung oder einen direkteren Codierungsansatz ermöglichen. Der direkte Vorteil besteht darin, dass DOM4J zwar den Preis einer komplexeren API zahlt, aber eine viel größere Flexibilität bietet als JDOM.

Obwohl DOM4J mehr Flexibilität, XPath-Integration und das Ziel bietet, große Dokumente zu verarbeiten, sind die Ziele dieselben wie bei JDOM: Benutzerfreundlichkeit und intuitive Bedienung für Java-Entwickler. Außerdem soll es eine umfassendere Lösung als JDOM sein und das Ziel erreichen, praktisch alle Java/XML-Probleme zu lösen. Während dieses Ziel erreicht wird, legt es weniger Wert als JDOM auf die Verhinderung fehlerhaften Anwendungsverhaltens.

DOM4J ist eine sehr, sehr hervorragende Java-XML-API mit hervorragender Leistung, leistungsstarken Funktionen und extremer Benutzerfreundlichkeit. Außerdem ist es eine Open-Source-Software. Heutzutage sieht man, dass immer mehr Java-Software DOM4J zum Lesen und Schreiben von XML verwendet. Besonders erwähnenswert ist, dass auch Suns JAXM DOM4J verwendet.

2… … Vergleich

1) DOM4J hat die beste Leistung, sogar Suns JAXM verwendet DOM4J. Derzeit verwenden viele Open-Source-Projekte DOM4J ausgiebig, zum Beispiel verwendet das berühmte Hibernate auch DOM4J, um XML zu lesen. Konfigurationsdatei. Wenn die Portabilität nicht berücksichtigt wird, verwenden Sie DOM4J.

2) JDOM und DOM zeigten beim Leistungstest eine schlechte Leistung und beim Testen von 10 Millionen Dokumenten kam es zu einem Speicherüberlauf. Auch bei kleinen Dokumenten lohnt es sich, über den Einsatz von DOM und JDOM nachzudenken. Obwohl die Entwickler von JDOM erklärt haben, dass sie sich vor der offiziellen Veröffentlichung auf Leistungsprobleme konzentrieren werden, gibt es aus Leistungssicht wirklich nichts zu empfehlen. Darüber hinaus ist DOM immer noch eine sehr gute Wahl. Die DOM-Implementierung wird häufig in vielen Programmiersprachen verwendet. Es ist auch die Grundlage für viele andere XML-bezogene Standards und da es offiziell vom W3C empfohlen wird (im Gegensatz zum nicht standardbasierten Java-Modell), kann es auch in bestimmten Arten von erforderlich sein Projekte (z. B. in Javascript verwendet DOM).

3) SAX bietet eine bessere Leistung, was von seiner spezifischen Parsing-Methode abhängt – Ereignis- Treiber . Ein SAX erkennt den eingehenden XML-Stream, lädt ihn jedoch nicht in den Speicher (natürlich werden einige Dokumente vorübergehend im Speicher ausgeblendet, wenn der XML-Stream gelesen wird).

3. Grundlegende Verwendung der vier XML-Operationsmethoden

XML-Datei:

<?xml version="1.0" encoding="GB2312"?> 
<RESULT> 
<VALUE> 
   <NO>A1234</NO> 
   <ADDR>四川省XX县XX镇XX路X段XX号</ADDR> 
</VALUE> 
<VALUE> 
   <NO>B1234</NO> 
   <ADDR>四川省XX市XX乡XX村XX组</ADDR> 
</VALUE> 
</RESULT>

1) DOM

import java.io.*; 
import java.util.*; 
import org.w3c.dom.*; 
import javax.xml.parsers.*; 

public class MyXMLReader{ 
 public static void main(String arge[]){ 
  long lasting =System.currentTimeMillis(); 
  try{ 
   File f=new File("data_10k.xml"); 
   DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
   DocumentBuilder builder=factory.newDocumentBuilder(); 
   Document doc = builder.parse(f); 
   NodeList nl = doc.getElementsByTagName("VALUE"); 
   for (int i=0;i<nl.getLength();i++){ 
    System.out.print("车牌号码:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue()); 
    System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue()); 
   } 
  }catch(Exception e){ 
   e.printStackTrace(); 
}

2) SAX

import org.xml.sax.*; 
import org.xml.sax.helpers.*; 
import javax.xml.parsers.*; 
public class MyXMLReader extends DefaultHandler { 
 java.util.Stack tags = new java.util.Stack(); 
 public MyXMLReader() { 
  super(); 
} 
 public static void main(String args[]) { 
  long lasting = System.currentTimeMillis(); 
  try { 
   SAXParserFactory sf = SAXParserFactory.newInstance(); 
   SAXParser sp = sf.newSAXParser(); 
   MyXMLReader reader = new MyXMLReader(); 
   sp.parse(new InputSource("data_10k.xml"), reader); 
  } catch (Exception e) { 
   e.printStackTrace(); 
  } 
  System.out.println("运行时间:" + (System.currentTimeMillis() - lasting) + "毫秒");} 
  public void characters(char ch[], int start, int length) throws SAXException { 
  String tag = (String) tags.peek(); 
  if (tag.equals("NO")) { 
   System.out.print("车牌号码:" + new String(ch, start, length)); 
} 
if (tag.equals("ADDR")) { 
  System.out.println("地址:" + new String(ch, start, length)); 
} 
} 
  public void startElement(String uri,String localName,String qName,Attributes attrs) { 
  tags.push(qName);} 
}

3) JDOM

import java.io.*; 
import java.util.*; 
import org.jdom.*; 
import org.jdom.input.*; 
public class MyXMLReader { 
 public static void main(String arge[]) { 
  long lasting = System.currentTimeMillis(); 
  try { 
   SAXBuilder builder = new SAXBuilder(); 
   Document doc = builder.build(new File("data_10k.xml")); 
   Element foo = doc.getRootElement(); 
   List allChildren = foo.getChildren(); 
   for(int i=0;i<allChildren.size();i++) { 
    System.out.print("车牌号码:" + ((Element)allChildren.get(i)).getChild("NO").getText()); 
    System.out.println("车主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText()); 
   } 
  } catch (Exception e) { 
   e.printStackTrace(); 
} 
}

4) DOM4J

import java.io.*; 
import java.util.*; 
import org.dom4j.*; 
import org.dom4j.io.*; 
public class MyXMLReader { 
 public static void main(String arge[]) { 
  long lasting = System.currentTimeMillis(); 
  try { 
   File f = new File("data_10k.xml"); 
   SAXReader reader = new SAXReader(); 
   Document doc = reader.read(f); 
   Element root = doc.getRootElement(); 
   Element foo; 
   for (Iterator i = root.elementIterator("VALUE"); i.hasNext() { 
    foo = (Element) i.next(); 
    System.out.print("车牌号码:" + foo.elementText("NO")); 
    System.out.println("车主地址:" + foo.elementText("ADDR")); 
   } 
  } catch (Exception e) { 
   e.printStackTrace(); 
}

Das obige ist der detaillierte Inhalt vonDetaillierte Einführung in den Vergleich von Codebeispielen für vier Möglichkeiten, XML in Java zu betreiben. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn