首頁 >後端開發 >XML/RSS教程 >XML解析之DOM4J解析的範例程式碼

XML解析之DOM4J解析的範例程式碼

黄舟
黄舟原創
2017-03-18 17:00:461632瀏覽

前言:公司的APP很早就有了,之前的介面結果處理都是透過XML的方式,並且在專案中,每個人處理XML的方式各種各樣,沒有統一的處理方式,所以在運用上很苦惱,所以樓主每次在專案開發中,為了節省自己的時間,不在研究其他人員XML的解析方式,只要遇到XML的地方,樓主就用DOM4J的方式解析。

關於XML的解析方式有好多種,DOM、SAX、JDOM等等,至於用法和原理這裡就不在說了(ps:樓主也不知道用法和原理)。這篇文章主要說說DOM4J的簡單操作和用法。

DOM4J介紹

dom4j是一個Java的XML API,是jdom的升級品,用來讀寫XML檔的。 dom4j是一個十分優秀的JavaXML API,具有性能優異、功能強大和極其易使用的特點,它的性能超過sun公司官方的dom技術,同時它也是一個開放源代碼的軟體,可以在SourceForge上找到它。

Dom4j是一個易用的、開源的函式庫,用於XML,XPath和XSLT。它應用於Java平台,採用了Java集合框架並完全支援DOM,SAX和JAXP。

這裡用一個簡單的例子來介紹DOM4J的用法。

注意:使用DOM4J解析XML,需要在專案中引入DOM4J的jar包

XML檔

<Response T=&#39;203&#39; T1=&#39;6&#39; TaskID=&#39;20130800001963&#39; MediaNum=&#39;3&#39; Result = &#39;1&#39; Desc=&#39;查询成功!&#39; >
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;1&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片1</Media>
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;2&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片2</Media>
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;3&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片3</Media>
</Response>

DOM4J使用詳解
步驟1:載入xml檔

載入xml可以分成主要的兩種方式

1、直接載入檔案所在的路徑位址

2、載入字串形式的xml (此方式主要是用在伺服器回傳結果)

1.1、直接載入檔案路徑

   SAXReader reader = new SAXReader();
        Document document = null;
        try {
            document = reader.read(new File("E://CZBK//day01//caseUp.xml"));
        } catch (DocumentException e) {
            e.printStackTrace();
        }

1.2、載入字串形式的xml

SAXReader reader = new SAXReader();
    Document document = null;
    try {
        //result是需要解析的字符串 
        //解析字符串需要转换成流的形式,可以指定转换字符编码
        document = reader.read(new ByteArrayInputStream(result.getBytes("UTF-8")));
    } catch (DocumentException  e) {
        e.printStackTrace();
    }

步驟2:解析XML

在解析XML之前,我們先來介紹下XML的結構稱呼,清楚下面4個問題對解析XML很有幫助

什麼是節點(node)?什麼是元素(element)?什麼是屬性(attribute)?什麼是文字值(value)?

節點:「Response」、「Media」這些稱為節點

元素:以完整的標籤結束稱為元素,包含整個元素內容。例如:dacf8c97ef3ca03c09586d5e039c32d1圖片1

。節點的屬性值。 ,對節點內容加之說明。例如:T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='查詢成功!'

文字值:「圖片1」稱為文字值。

在專案中無非就是圍繞元素、屬性和文字值進行操作,所以掌握好這三部分的取值方法,也就掌握了XML解析。

2.1、取得根節點

 //获取整个文档
        Element rootElement = document.getRootElement();

rootElement包含整個xml文件的內容,也就是Response標籤所包含的所有內容

2.2、取得Response節點的屬性值

 //获取Response节点的Result属性值
        String responseResult = rootElement.attributeValue("Result");
2.3、取得Media元素
//获取第一个Media元素
        Element mediaElement = rootElement.element("Media");
        //获取所有的Media元素
        List allMeidaElements = rootElement.elements("Media");

2.4、取得Media屬性值

 //获取第一个Media元素的Name属性值
        String mediaName = mediaElement.attributeValue("Name");
        //遍历所有的Media元素的Name属性值
        for (int i = 0; i < allMeidaElements.size(); i++) {
            Element element = (Element) allMeidaElements.get(i);
            String name = element.attributeValue("Name");
        }

2.5、取得Media標籤的文字值

    //获取第一个Meida元素的文本值
        String value = mediaElement.getText();
完整程式碼

import java.io.File;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Textxml {
    public void xml() {
        SAXReader reader = new SAXReader();
        Document document = null;
        try {
            document = reader.read(new File("E://CZBK//day01//caseUp.xml"));
        } catch (DocumentException e) {
            e.printStackTrace();
        }
        //获取整个文档
        Element rootElement = document.getRootElement();
        System.out.println("整个文档:"+rootElement.asXML());
        //获取Response节点的Result属性值
        String responseResult = rootElement.attributeValue("Result");
        System.out.println("Response节点的Result属性值:"+responseResult);
        //获取第一个Media元素
        Element mediaElement = rootElement.element("Media");
        System.out.println("第一个Media元素:"+mediaElement.asXML());
        //获取所有的Media元素
        List allMeidaElements = rootElement.elements("Media");
        //获取第一个Media元素的Name属性值
        String mediaName = mediaElement.attributeValue("Name");
        System.out.println("第一个Media元素的Name属性值:"+mediaName);
        //遍历所有的Media元素的Name属性值
        for (int i = 0; i < allMeidaElements.size(); i++) {
            Element element = (Element) allMeidaElements.get(i);
            String name = element.attributeValue("Name");
        }
        //获取第一个Meida元素的文本值
        String value = mediaElement.getText();
        System.out.println("第一个Meida元素的文本值:"+value);
    }
    public static void main(String[] args) {
        Textxml textxml = new Textxml();
        textxml.xml();
    }
}

運行結果

整个文档:<Response T="203" T1="6" TaskID="20130800001963" MediaNum="3" Result="1" Desc="查询成功!">
<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
    <Media Name="IMG_20130425_141838.jpg" Mediasource="2" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片2</Media>
    <Media Name="IMG_20130425_141838.jpg" Mediasource="3" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片3</Media>
</Response>
Response节点的Result属性值:1
第一个Media元素:<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
第一个Media元素的Name属性值:IMG_20130425_141838.jpg
第一个Meida元素的文本值:图片1

########1、XML解析方式有很多中,未必每種都要掌握,把其中的一種解析弄清楚就夠用了,至於效能上的差別樓主體會不出來,也不能解答這個問題######2、DOM4J的API有很多,這篇文章中只是介紹了最基本的最常用的幾種,如果有興趣可以自行研究使用###############

以上是XML解析之DOM4J解析的範例程式碼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn