Zusammenfassung des Beispielcodes für das Java-Parsing von XML-XML/RSS-Tutorial-php.cn

Heim

Backend-Entwicklung

XML/RSS-Tutorial

Zusammenfassung des Beispielcodes für das Java-Parsing von XML

黄舟

Mar 11, 2017 pm 05:59 PM

[Einführung]

Es gibt viele Technologien, die derzeit zum Parsen von XML in Java verwendet werden. Zu den gängigen gehören DOM, SAX, JDOM und DOM4j. Im Folgenden werden hauptsächlich die Verwendung, Vor- und Nachteile sowie Leistungstests dieser vier XML-Dokument-Parsing-Technologien vorgestellt.

1. [Grundkenntnisse – Alphabetisierung]

Sax und Dom sind zwei Methoden zum Parsen von XML-Dokumenten (keine spezifische Implementierung, nur interface ), sodass sie alleine keine XML-Dokumente analysieren können; jaxp ist nur api, das Sax- und Dom-Schnittstellen weiter kapselt und DomcumentBuilderFactory/DomcumentBuilder und SAXParserFactory /SAXParser bereitstellt (standardmäßig wird der Xerces-Interpreter verwendet).

2. [Einfache Einführung in DOM, SAX, JDOM, DOM4j]

1 Objekt Modell) 】Die von
W3C bereitgestellte Schnittstelle, die den gesamten XML-Dokumentspeicher liest Erstellen Sie einen DOM-Baum, um jeden Knoten (Knoten) zu betreiben. Beispielcode:

<?xml version="1.0" encoding="UTF-8"?>  
<university name="pku">  
    <college name="c1">  
        <class name="class1">  
            <student name="stu1" sex=&#39;male&#39; age="21" />  
            <student name="stu2" sex=&#39;female&#39; age="20" />  
            <student name="stu3" sex=&#39;female&#39; age="20" />  
        </class>  
        <class name="class2">  
            <student name="stu4" sex=&#39;male&#39; age="19" />  
            <student name="stu5" sex=&#39;female&#39; age="20" />  
            <student name="stu6" sex=&#39;female&#39; age="21" />  
        </class>  
    </college>  
    <college name="c2">  
        <class name="class3">  
            <student name="stu7" sex=&#39;male&#39; age="20" />  
        </class>  
    </college>  
    <college name="c3">  
    </college>  
</university>

text.xml wird im folgenden Code verwendet (dieses Dokument wird im Quellpfad abgelegt und kompiliert). Klassenpfad), alle beziehen sich auf das XML-Dokument.

package test.xml;  
  
import java.io.File;  
import java.io.FileNotFoundException;  
import java.io.FileOutputStream;  
import java.io.IOException;  
import java.io.InputStream;  
  
import javax.xml.parsers.DocumentBuilder;  
import javax.xml.parsers.DocumentBuilderFactory;  
import javax.xml.parsers.ParserConfigurationException;  
import javax.xml.transform.Transformer;  
import javax.xml.transform.TransformerConfigurationException;  
import javax.xml.transform.TransformerException;  
import javax.xml.transform.TransformerFactory;  
import javax.xml.transform.dom.DOMSource;  
import javax.xml.transform.stream.StreamResult;  
  
import org.w3c.dom.Document;  
import org.w3c.dom.Element;  
import org.w3c.dom.Node;  
import org.w3c.dom.NodeList;  
import org.w3c.dom.Text;  
import org.xml.sax.SAXException;  
  
/** 
 * dom读写xml 
 * @author whwang 
 */  
public class TestDom {  
      
    public static void main(String[] args) {  
        read();  
        //write();   
    }  
      
    public static void read() {  
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
        try {  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            // root <university>   
            Element root = doc.getDocumentElement();  
            if (root == null) return;  
            System.err.println(root.getAttribute("name"));  
            // all college node   
            NodeList collegeNodes = root.getChildNodes();  
            if (collegeNodes == null) return;  
            for(int i = 0; i < collegeNodes.getLength(); i++) {  
                Node college = collegeNodes.item(i);  
                if (college != null && college.getNodeType() == Node.ELEMENT_NODE) {  
                    System.err.println("\t" + college.getAttributes().getNamedItem("name").getNodeValue());  
                    // all class node   
                    NodeList classNodes = college.getChildNodes();  
                    if (classNodes == null) continue;  
                    for (int j = 0; j < classNodes.getLength(); j++) {  
                        Node clazz = classNodes.item(j);  
                        if (clazz != null && clazz.getNodeType() == Node.ELEMENT_NODE) {  
                            System.err.println("\t\t" + clazz.getAttributes().getNamedItem("name").getNodeValue());  
                            // all student node   
                            NodeList studentNodes = clazz.getChildNodes();  
                            if (studentNodes == null) continue;  
                            for (int k = 0; k < studentNodes.getLength(); k++) {  
                                Node student = studentNodes.item(k);  
                                if (student != null && student.getNodeType() == Node.ELEMENT_NODE) {  
                                    System.err.print("\t\t\t" + student.getAttributes().getNamedItem("name").getNodeValue());  
                                    System.err.print(" " + student.getAttributes().getNamedItem("sex").getNodeValue());  
                                    System.err.println(" " + student.getAttributes().getNamedItem("age").getNodeValue());  
                                }  
                            }  
                        }  
                    }  
                }  
            }  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (FileNotFoundException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
          
    }  
      
    public static void write() {  
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
        try {  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            // root <university>   
            Element root = doc.getDocumentElement();  
            if (root == null) return;  
            // 修改属性   
            root.setAttribute("name", "tsu");  
            NodeList collegeNodes = root.getChildNodes();  
            if (collegeNodes != null) {  
                for (int i = 0; i <collegeNodes.getLength() - 1; i++) {  
                    // 删除节点   
                    Node college = collegeNodes.item(i);  
                    if (college.getNodeType() == Node.ELEMENT_NODE) {  
                        String collegeName = college.getAttributes().getNamedItem("name").getNodeValue();  
                        if ("c1".equals(collegeName) || "c2".equals(collegeName)) {  
                            root.removeChild(college);  
                        } else if ("c3".equals(collegeName)) {  
                            Element newChild = doc.createElement("class");  
                            newChild.setAttribute("name", "c4");  
                            college.appendChild(newChild);  
                        }  
                    }  
                }  
            }  
            // 新增节点   
            Element addCollege = doc.createElement("college");  
            addCollege.setAttribute("name", "c5");  
            root.appendChild(addCollege);  
            Text text = doc.createTextNode("text");  
            addCollege.appendChild(text);  
              
            // 将修改后的文档保存到文件   
            TransformerFactory transFactory = TransformerFactory.newInstance();  
            Transformer transFormer = transFactory.newTransformer();  
            DOMSource domSource = new DOMSource(doc);  
            File file = new File("src/dom-modify.xml");  
            if (file.exists()) {  
                file.delete();  
            }  
            file.createNewFile();  
            FileOutputStream out = new FileOutputStream(file);           
            StreamResult xmlResult = new StreamResult(out);  
            transFormer.transform(domSource, xmlResult);  
            System.out.println(file.getAbsolutePath());  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        } catch (TransformerConfigurationException e) {  
            e.printStackTrace();  
        } catch (TransformerException e) {  
            e.printStackTrace();  
        }  
    }  
}

Solange der Code leicht geändert wird, kann er prägnanter werden. Es ist nicht erforderlich, ständig zu schreiben, ob es untergeordnete Knoten gibt.

2. [SAX (Simple API for XML)] SAX muss nicht das gesamte Dokument in den Speicher laden, Basierend auf
Ereignis steuert die API von (Beobachtermodus). Benutzer müssen nur die Ereignisse registrieren, an denen sie interessiert sind. SAX bietet EntityResolver-, DTDHandler-, ContentHandler- und ErrorHandler-Schnittstellen, die zum Überwachen von Parsing-Entitätsereignissen, DTD-Verarbeitungsereignissen, Textverarbeitungsereignissen bzw. Verarbeitungsfehlerereignissen verwendet werden. Ähnlich wie AWT bietet SAX auch eine Standardklasse DefaultHandler für diese vier Schnittstellen (die Standardimplementierung ist hier eigentlich eine leere Methode, Sie müssen nur DefaultHandler erben und die Ereignisse, an denen Sie interessiert sind, neu schreiben). Beispielcode:

3. [JDOM]

package test.xml;  
  
import java.io.IOException;  
import java.io.InputStream;  
  
import javax.xml.parsers.ParserConfigurationException;  
import javax.xml.parsers.SAXParser;  
import javax.xml.parsers.SAXParserFactory;  
  
import org.xml.sax.Attributes;  
import org.xml.sax.InputSource;  
import org.xml.sax.Locator;  
import org.xml.sax.SAXException;  
import org.xml.sax.SAXParseException;  
import org.xml.sax.helpers.DefaultHandler;  
  
/** 
 * 
 * @author whwang 
 */  
public class TestSAX {  
  
    public static void main(String[] args) {  
        read();  
        write();  
    }  
      
    public static void read() {  
        try {  
            SAXParserFactory factory = SAXParserFactory.newInstance();  
            SAXParser parser = factory.newSAXParser();  
            InputStream in = TestSAX.class.getClassLoader().getResourceAsStream("test.xml");  
            parser.parse(in, new MyHandler());  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
      
    public static void write() {  
        System.err.println("纯SAX对于写操作无能为力");  
    }  
      
}  
  
// 重写对自己感兴趣的事件处理方法   
class MyHandler extends DefaultHandler {  
  
    @Override  
    public InputSource resolveEntity(String publicId, String systemId)  
            throws IOException, SAXException {  
        return super.resolveEntity(publicId, systemId);  
    }  
  
    @Override  
    public void notationDecl(String name, String publicId, String systemId)  
            throws SAXException {  
        super.notationDecl(name, publicId, systemId);  
    }  
  
    @Override  
    public void unparsedEntityDecl(String name, String publicId,  
            String systemId, String notationName) throws SAXException {  
        super.unparsedEntityDecl(name, publicId, systemId, notationName);  
    }  
  
    @Override  
    public void setDocumentLocator(Locator locator) {  
        super.setDocumentLocator(locator);  
    }  
  
    @Override  
    public void startDocument() throws SAXException {  
        System.err.println("开始解析文档");  
    }  
  
    @Override  
    public void endDocument() throws SAXException {  
        System.err.println("解析结束");  
    }  
  
    @Override  
    public void startPrefixMapping(String prefix, String uri)  
            throws SAXException {  
        super.startPrefixMapping(prefix, uri);  
    }  
  
    @Override  
    public void endPrefixMapping(String prefix) throws SAXException {  
        super.endPrefixMapping(prefix);  
    }  
  
    @Override  
    public void startElement(String uri, String localName, String qName,  
            Attributes attributes) throws SAXException {  
        System.err.print("Element: " + qName + ", attr: ");  
        print(attributes);  
    }  
  
    @Override  
    public void endElement(String uri, String localName, String qName)  
            throws SAXException {  
        super.endElement(uri, localName, qName);  
    }  
  
    @Override  
    public void characters(char[] ch, int start, int length)  
            throws SAXException {  
        super.characters(ch, start, length);  
    }  
  
    @Override  
    public void ignorableWhitespace(char[] ch, int start, int length)  
            throws SAXException {  
        super.ignorableWhitespace(ch, start, length);  
    }  
  
    @Override  
    public void processingInstruction(String target, String data)  
            throws SAXException {  
        super.processingInstruction(target, data);  
    }  
  
    @Override  
    public void skippedEntity(String name) throws SAXException {  
        super.skippedEntity(name);  
    }  
  
    @Override  
    public void warning(SAXParseException e) throws SAXException {  
        super.warning(e);  
    }  
  
    @Override  
    public void error(SAXParseException e) throws SAXException {  
        super.error(e);  
    }  
  
    @Override  
    public void fatalError(SAXParseException e) throws SAXException {  
        super.fatalError(e);  
    }  
      
    private void print(Attributes attrs) {  
        if (attrs == null) return;  
        System.err.print("[");  
        for (int i = 0; i < attrs.getLength(); i++) {  
            System.err.print(attrs.getQName(i) + " = " + attrs.getValue(i));  
            if (i != attrs.getLength() - 1) {  
                System.err.print(", ");  
            }  
        }  
        System.err.println("]");  
    }  
}

JDOM und DOM Sehr ähnlich, es handelt sich um eine reine JAVA-API zur Verarbeitung von XML, die API nutzt in großem Umfang die Collections-Klasse und JDOM verwendet nur konkrete Klassen und keine Schnittstellen. JDOM selbst enthält keinen Parser. Es verwendet normalerweise einen SAX2-Parser, um XML-Eingabedokumente zu analysieren und zu validieren (obwohl es auch zuvor erstellte DOM-Darstellungen als Eingabe verwenden kann). Es enthält Konverter zur Ausgabe von JDOM-Darstellungen in SAX2-Ereignisströme, DOM--Modelle oder XML-Textdokumente
Beispielcode:

4. [DOM4j]

package test.xml;  
  
import java.io.File;  
import java.io.FileOutputStream;  
import java.io.IOException;  
import java.io.InputStream;  
import java.util.List;  
  
import org.jdom.Attribute;  
import org.jdom.Document;  
import org.jdom.Element;  
import org.jdom.JDOMException;  
import org.jdom.input.SAXBuilder;  
import org.jdom.output.XMLOutputter;  
  
/** 
 * JDom读写xml 
 * @author whwang 
 */  
public class TestJDom {  
    public static void main(String[] args) {  
        //read();   
        write();  
    }  
      
    public static void read() {  
        try {  
            boolean validate = false;  
            SAXBuilder builder = new SAXBuilder(validate);  
            InputStream in = TestJDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.build(in);  
            // 获取根节点 <university>   
            Element root = doc.getRootElement();  
            readNode(root, "");  
        } catch (JDOMException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
      
    @SuppressWarnings("unchecked")  
    public static void readNode(Element root, String prefix) {  
        if (root == null) return;  
        // 获取属性   
        List<Attribute> attrs = root.getAttributes();  
        if (attrs != null && attrs.size() > 0) {  
            System.err.print(prefix);  
            for (Attribute attr : attrs) {  
                System.err.print(attr.getValue() + " ");  
            }  
            System.err.println();  
        }  
        // 获取他的子节点   
        List<Element> childNodes = root.getChildren();  
        prefix += "\t";  
        for (Element e : childNodes) {  
            readNode(e, prefix);  
        }  
    }  
      
    public static void write() {  
        boolean validate = false;  
        try {  
            SAXBuilder builder = new SAXBuilder(validate);  
            InputStream in = TestJDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.build(in);  
            // 获取根节点 <university>   
            Element root = doc.getRootElement();  
            // 修改属性   
            root.setAttribute("name", "tsu");  
            // 删除   
            boolean isRemoved = root.removeChildren("college");  
            System.err.println(isRemoved);  
            // 新增   
            Element newCollege = new Element("college");  
            newCollege.setAttribute("name", "new_college");  
            Element newClass = new Element("class");  
            newClass.setAttribute("name", "ccccc");  
            newCollege.addContent(newClass);  
            root.addContent(newCollege);  
            XMLOutputter out = new XMLOutputter();  
            File file = new File("src/jdom-modify.xml");  
            if (file.exists()) {  
                file.delete();  
            }  
            file.createNewFile();  
            FileOutputStream fos = new FileOutputStream(file);  
            out.output(doc, fos);  
        } catch (JDOMException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
      
}

dom4j ist derzeit das beste XML-Parsing (Hibernate und Suns JAXM verwenden dom4j auch zum Parsen von XML). Darstellung, einschließlich integrierter XPath-Unterstützung, XML-Schema-Unterstützung und ereignisbasierter Verarbeitung
für große oder Streaming-Dokumente Beispielcode:

package test.xml;  
  
import java.io.File;  
import java.io.FileWriter;  
import java.io.IOException;  
import java.io.InputStream;  
import java.util.List;  
  
import org.dom4j.Attribute;  
import org.dom4j.Document;  
import org.dom4j.DocumentException;  
import org.dom4j.DocumentHelper;  
import org.dom4j.Element;  
import org.dom4j.ProcessingInstruction;  
import org.dom4j.VisitorSupport;  
import org.dom4j.io.SAXReader;  
import org.dom4j.io.XMLWriter;  
  
/** 
 * Dom4j读写xml 
 * @author whwang 
 */  
public class TestDom4j {  
    public static void main(String[] args) {  
        read1();  
        //read2();   
        //write();   
    }  
  
    public static void read1() {  
        try {  
            SAXReader reader = new SAXReader();  
            InputStream in = TestDom4j.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = reader.read(in);  
            Element root = doc.getRootElement();  
            readNode(root, "");  
        } catch (DocumentException e) {  
            e.printStackTrace();  
        }  
    }  
      
    @SuppressWarnings("unchecked")  
    public static void readNode(Element root, String prefix) {  
        if (root == null) return;  
        // 获取属性   
        List<Attribute> attrs = root.attributes();  
        if (attrs != null && attrs.size() > 0) {  
            System.err.print(prefix);  
            for (Attribute attr : attrs) {  
                System.err.print(attr.getValue() + " ");  
            }  
            System.err.println();  
        }  
        // 获取他的子节点   
        List<Element> childNodes = root.elements();  
        prefix += "\t";  
        for (Element e : childNodes) {  
            readNode(e, prefix);  
        }  
    }  
      
    public static void read2() {  
        try {  
            SAXReader reader = new SAXReader();  
            InputStream in = TestDom4j.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = reader.read(in);  
            doc.accept(new MyVistor());  
        } catch (DocumentException e) {  
            e.printStackTrace();  
        }  
    }  
      
    public static void write() {  
        try {  
            // 创建一个xml文档   
            Document doc = DocumentHelper.createDocument();  
            Element university = doc.addElement("university");  
            university.addAttribute("name", "tsu");  
            // 注释   
            university.addComment("这个是根节点");  
            Element college = university.addElement("college");  
            college.addAttribute("name", "cccccc");  
            college.setText("text");  
              
            File file = new File("src/dom4j-modify.xml");  
            if (file.exists()) {  
                file.delete();  
            }  
            file.createNewFile();  
            XMLWriter out = new XMLWriter(new FileWriter(file));  
            out.write(doc);  
            out.flush();  
            out.close();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
}  
  
class MyVistor extends VisitorSupport {  
    public void visit(Attribute node) {  
        System.out.println("Attibute: " + node.getName() + "="  
                + node.getValue());  
    }  
  
    public void visit(Element node) {  
        if (node.isTextOnly()) {  
            System.out.println("Element: " + node.getName() + "="  
                    + node.getText());  
        } else {  
            System.out.println(node.getName());  
        }  
    }  
  
    @Override  
    public void visit(ProcessingInstruction node) {  
        System.out.println("PI:" + node.getTarget() + " " + node.getText());  
    }  
}

三、【性能测试】

环境：AMD4400+ 2.0+GHz主频 JDK6.0
运行参数：-Xms400m -Xmx400m
xml文件大小：10.7M
结果：
DOM: >581297ms
SAX: 8829ms
JDOM: 581297ms
DOM4j: 5309ms
时间包括IO的，只是进行了简单的测试，仅供参考！！！！

四、【对比】

1、【DOM】
DOM是基于树的结构，通常需要加载整文档和构造DOM树，然后才能开始工作。
优点：
   a、由于整棵树在内存中，因此可以对xml文档随机访问
   b、可以对xml文档进行修改操作
   c、较sax，dom使用也更简单。
缺点：
   a、整个文档必须一次性解析完
   a、由于整个文档都需要载入内存，对于大文档成本高
2、【SAX】
SAX类似流媒体，它基于事件驱动的，因此无需将整个文档载入内存，使用者只需要监听自己感兴趣的事件即可。
优点：
   a、无需将整个xml文档载入内存，因此消耗内存少
   b、可以注册多个ContentHandler
缺点：
   a、不能随机的访问xml中的节点
   b、不能修改文档
3、【JDOM】
JDOM是纯Java的处理XML的API，其API中大量使用Collections类，
优点：
   a、DOM方式的优点
   b、具有SAX的Java规则
缺点
   a、DOM方式的缺点
4、【DOM4J】
这4中xml解析方式中，最优秀的一个，集易用和性能于一身。

五、【小插曲XPath】

XPath 是一门在 XML 文档中查找信息的语言，可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上。因此，对 XPath 的理解是很多高级 XML 应用的基础。
XPath非常类似对数据库操作的SQL语言，或者说JQuery，它可以方便开发者抓起文档中需要的东西。（dom4j也支持xpath）
示例代码：

package test.xml;  
  
import java.io.IOException;  
import java.io.InputStream;  
  
import javax.xml.parsers.DocumentBuilder;  
import javax.xml.parsers.DocumentBuilderFactory;  
import javax.xml.parsers.ParserConfigurationException;  
import javax.xml.xpath.XPath;  
import javax.xml.xpath.XPathConstants;  
import javax.xml.xpath.XPathExpression;  
import javax.xml.xpath.XPathExpressionException;  
import javax.xml.xpath.XPathFactory;  
  
import org.w3c.dom.Document;  
import org.w3c.dom.NodeList;  
import org.xml.sax.SAXException;  
  
public class TestXPath {  
  
    public static void main(String[] args) {  
        read();  
    }  
      
    public static void read() {  
        try {  
            DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestXPath.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            XPathFactory factory = XPathFactory.newInstance();  
            XPath xpath = factory.newXPath();  
            // 选取所有class元素的name属性   
            // XPath语法介绍： http://w3school.com.cn/xpath/   
            XPathExpression expr = xpath.compile("//class/@name");  
            NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);  
            for (int i = 0; i < nodes.getLength(); i++) {  
                System.out.println("name = " + nodes.item(i).getNodeValue());  
                    }  
        } catch (XPathExpressionException e) {  
            e.printStackTrace();  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
      
}

六、【补充】

注意4种解析方法对TextNode（文本节点）的处理：

1、在使用DOM时，调用node.getChildNodes()获取该节点的子节点，文本节点也会被当作一个Node来返回，如：

<?xml version="1.0" encoding="UTF-8"?>  
<university name="pku">  
    <college name="c1">  
        <class name="class1">  
            <student name="stu1" sex=&#39;male&#39; age="21" />  
            <student name="stu2" sex=&#39;female&#39; age="20" />  
            <student name="stu3" sex=&#39;female&#39; age="20" />  
        </class>  
    </college>  
</university>

package test.xml;  
  
import java.io.FileNotFoundException;  
import java.io.IOException;  
import java.io.InputStream;  
import java.util.Arrays;  
  
import javax.xml.parsers.DocumentBuilder;  
import javax.xml.parsers.DocumentBuilderFactory;  
import javax.xml.parsers.ParserConfigurationException;  
  
import org.w3c.dom.Document;  
import org.w3c.dom.Element;  
import org.w3c.dom.Node;  
import org.w3c.dom.NodeList;  
import org.xml.sax.SAXException;  
  
/** 
 * dom读写xml 
 * @author whwang 
 */  
public class TestDom2 {  
      
    public static void main(String[] args) {  
        read();  
    }  
      
    public static void read() {  
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
        try {  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestDom2.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            // root <university>   
            Element root = doc.getDocumentElement();  
            if (root == null) return;  
//          System.err.println(root.getAttribute("name"));   
            // all college node   
            NodeList collegeNodes = root.getChildNodes();  
            if (collegeNodes == null) return;  
            System.err.println("university子节点数：" + collegeNodes.getLength());  
            System.err.println("子节点如下：");  
            for(int i = 0; i < collegeNodes.getLength(); i++) {  
                Node college = collegeNodes.item(i);  
                if (college == null) continue;  
                if (college.getNodeType() == Node.ELEMENT_NODE) {  
                    System.err.println("\t元素节点：" + college.getNodeName());  
                } else if (college.getNodeType() == Node.TEXT_NODE) {  
                    System.err.println("\t文本节点：" + Arrays.toString(college.getTextContent().getBytes()));  
                }  
            }  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (FileNotFoundException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
          
    }  
}

输出的结果是：

university子节点数：3  
子节点如下：  
    文本节点：[10, 9]  
    元素节点：college  
    文本节点：[10]

其中\n的ASCII码为10，\t的ASCII码为9。结果让人大吃一惊，university的子节点数不是1，也不是2，而是3，这3个子节点都是谁呢？为了看得更清楚点，把xml文档改为：

<?xml version="1.0" encoding="UTF-8"?>  
<university name="pku">11  
    <college name="c1">  
        <class name="class1">  
            <student name="stu1" sex=&#39;male&#39; age="21" />  
            <student name="stu2" sex=&#39;female&#39; age="20" />  
            <student name="stu3" sex=&#39;female&#39; age="20" />  
        </class>  
    </college>22  
</university>

还是上面的程序，输出结果为：

university子节点数：3  
子节点如下：  
    文本节点：[49, 49, 10, 9]  
    元素节点：college  
    文本节点：[50, 50, 10]

其中数字1的ASCII码为49，数字2的ASCII码为50。

2、使用SAX来解析同DOM，当你重写它的public void characters(char[] ch, int start, int length)方法时，你就能看到。

3、JDOM，调用node.getChildren()只返回子节点，不包括TextNode节点（不管该节点是否有Text信息）。如果要获取该节点的Text信息，可以调用node.getText()方法，该方法返回节点的Text信息，也包括\n\t等特殊字符。

4、DOM4j同JDOM

Das obige ist der detaillierte Inhalt vonZusammenfassung des Beispielcodes für das Java-Parsing von XML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

Bauen von Futtermitteln mit XML: Ein praktischer Anleitung zu RSSApr 14, 2025 am 12:17 AM

Die Schritte zum Erstellen eines RSSFeeds mit XML sind wie folgt: 1. Erstellen Sie das Stammelement und setzen Sie die Version; 2. Fügen Sie das Kanalelement und seine grundlegenden Informationen hinzu; 3. Fügen Sie das Eintragselement hinzu, einschließlich des Titels, des Links und der Beschreibung; 4. Konvertieren Sie die XML -Struktur in eine Zeichenfolge und geben Sie sie aus. Mit diesen Schritten können Sie eine gültige RSSFeed von Grund auf neu erstellen und seine Funktionalität verbessern, indem Sie zusätzliche Elemente wie Erscheinungsdatum und Autoreninformationen hinzufügen.

Erstellen von RSS-Dokumenten: Ein Schritt-für-Schritt-TutorialApr 13, 2025 am 12:10 AM

Die Schritte zum Erstellen eines RSS -Dokuments sind wie folgt: 1. Schreiben Sie im XML -Format mit dem Stammelement, einschließlich der Elemente. 2. Hinzufügen usw. Elemente, um Kanalinformationen zu beschreiben. 3. Fügen Sie Elemente hinzu, die jeweils einen Inhaltseintrag darstellen, einschließlich ,,,,,,,,,. 4. Fügen Sie optional Elemente hinzu, um den Inhalt zu bereichern. 5. Stellen Sie sicher, dass das XML -Format korrekt ist, verwenden Sie Online -Tools, um die Leistung zu optimieren und den Inhalt auf dem neuesten Stand zu halten.

Die Rolle von XML in RSS: Die Grundlage von syndizierten InhaltenApr 12, 2025 am 12:17 AM

Die Kernrolle von XML in RSS besteht darin, ein standardisiertes und flexibles Datenformat bereitzustellen. 1. Die Struktur- und Markup -Sprachmerkmale von XML machen es für den Datenaustausch und Speicher für den Daten. 2. RSS verwendet XML, um ein standardisiertes Format zu erstellen, um die Inhaltsfreigabe zu erleichtern. 3. Die Anwendung von XML in RSS enthält Elemente, die Futterinhalte wie Titel und Veröffentlichungsdatum definieren. 4. Vorteile umfassen Standardisierung und Skalierbarkeit sowie Herausforderungen umfassen dokumentausführende und strenge Syntaxanforderungen. 5. Zu den Best Practices gehört die Validierung der XML -Gültigkeit, die einfache Haltung, die Verwendung von CDATA und die regelmäßige Aktualisierung.

Von XML zu lesbaren Inhalten: entmystifizierende RSS -FeedsApr 11, 2025 am 12:03 AM

RssfeedsarexmldocumentsUTForContentAggregation und Distribution

Gibt es eine RSS -Alternative, die auf JSON basiert?Apr 10, 2025 am 09:31 AM

JSONFEED ist eine JSON-basierte RSS-Alternative, die die Einfachheit und Benutzerfreundlichkeit hat. 1) JSONFEED verwendet das JSON -Format, das leicht zu erzeugen und analysieren zu können. 2) Es unterstützt die dynamische Generation und eignet sich für die moderne Webentwicklung. 3) Die Verwendung von JSONFeed kann die Effizienz und die Benutzererfahrung des Inhaltsmanagements verbessern.

RSS -Dokumentenwerkzeuge: Erstellen, Validieren und Veröffentlichen von FeedsApr 09, 2025 am 12:10 AM

Wie baue, validieren und veröffentlichen Sie RSSFeeds? 1. Build: Verwenden Sie Python -Skripte, um RSSFeed einschließlich Titel, Link, Beschreibung und Veröffentlichungsdatum zu generieren. 2. Überprüfung: Verwenden Sie Feedvalidator.org oder Python -Skript, um zu überprüfen, ob RSSFeed die RSS2.0 -Standards entspricht. 3. Veröffentlichen: Laden Sie RSS -Dateien auf den Server hoch oder verwenden Sie Flask, um RSSFeed dynamisch zu generieren und zu veröffentlichen. Durch diese Schritte können Sie Inhalte effektiv verwalten und teilen.

Sicherung Ihrer XML/RSS -Feeds: Eine umfassende Sicherheits -ChecklisteApr 08, 2025 am 12:06 AM

Methoden zur Gewährleistung der Sicherheit von XML/RSSFeeds umfassen: 1. Datenüberprüfung, 2. Verschlüsselter Transmission, 3. Zugriffskontrolle, 4. Protokolle und Überwachung. Diese Maßnahmen schützen die Integrität und Vertraulichkeit von Daten durch Netzwerksicherheitsprotokolle, Datenverschlüsselungsalgorithmen und Zugriffskontrollmechanismen.

XML/RSS -Interview Fragen und Antworten: Stufen Sie Ihr Fachwissen aufApr 07, 2025 am 12:19 AM

XML ist eine Markup-Sprache, die zum Speichern und Übertragen von Daten verwendet wird, und RSS ist ein XML-basiertes Format, das zur Veröffentlichung häufig aktualisierter Inhalte verwendet wird. 1) XML beschreibt Datenstrukturen durch Tags und Attribute, 2) RSS definiert spezifische Tag -Veröffentlichungen und abonnierte Inhalte, 3) XML kann erstellt und unter Verwendung von Pythons xml.etree.elementtree -Modul, 4) XML -Knoten für Xpath Expressions, 5). Validiert werden durch Xmllint, 7) Verarbeitung großer XML -Dateien mit SAX -Parser kann die Leistung optimieren.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vorByDDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

1 Monate vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Dreamweaver Mac

Visuelle Webentwicklungstools

Sicherer Prüfungsbrowser

Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

WebStorm-Mac-Version

Nützliche JavaScript-Entwicklungstools

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

DVWA

Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7496

CakePHP-Tutorial

1377

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten