搜尋
首頁後端開發XML/RSS教程XML—XML解析之DOM4J

XML—XML解析之DOM4J

Feb 24, 2017 pm 03:14 PM


首先為什麼會有Dom4j呢?

因為DOM太耗內存,而SAX只能對XML進行讀取,而不能去添加、刪除等。所以出現了Dom4j,它的效率更高,同時也可以進行crud操作。

1.DOM4J介紹

  • #Dom4j是一個簡單、靈活地開放原始碼的函式庫。 Dom4j是由早期開發JDOM的人分離出來而後獨立開發的。與JDOM不同的是,dom4j使用介面和抽象基類,雖然Dom4j的API相對要複雜一些,但它提供了比JDOM更好的靈活性。

  • Dom4j是一個非常優秀的Java XML API,具有效能優異、功能強大且極易使用的特性。現在很多軟體採用的Dom4j,例如Hibernate,包括Sun公司自己的JAXP也用了Dom4j。

  • 使用Dom4j開發,需下載dom4j對應的jar文件,並匯入到專案。下載地址dom4j下載

2.DOM4J案例

依然使用我們先前的XML檔:

<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>

該文件放在com.dom4j.test套件中。

使用DOM4J也要取得代表整個文件Document對象,不過這個Document對像是org.dom4j套件中的。

在主方法中取得Document物件如下:

// 1.得到一个解析器SAXReader saxReader = new SAXReader();
// 2.指定解析哪个XML文件Document document = saxReader.read(new File("src/com/dom4j/test/myClass.xml"));

然後我們就可以根據需求來寫對應的方法,在主方法中呼叫。

【1】指定讀取某個元素(讀取第一個學生的資訊)

public static void read(Document document) {    // 得到根元素
    Element root = document.getRootElement();    // root.elements("学生"):表示取出root下的所有学生元素
    // root.element("学生"):表示取出root下的第一个学生元素
    Element student = root.element("学生");    // 取出属性
    String address = student.attributeValue("地址");    // 取出各个子节点的值
    String name = student.element("名字").getText();
    String age = student.element("年龄").getText();
    String intro = student.element("介绍").getText();

    System.out.println(address);
    System.out.println(name);
    System.out.println(age);
    System.out.println(intro);
}

【2】新增元素:新增一個學生資訊到XML文件中

public static void add(Document document) throws Exception {    // 首先我们来创建一个学生节点对象
    Element student = DocumentHelper.createElement("学生");
    Element name = DocumentHelper.createElement("名字");
    name.setText("小强");
    Element age = DocumentHelper.createElement("年龄");
    age.setText("22");
    Element intro = DocumentHelper.createElement("介绍");
    intro.setText("是一个三好学生");    // 把三个子元素加到student节点下
    student.add(name);
    student.add(age);
    student.add(intro);    // 为学生添加属性
    student.addAttribute("地址", "大理");    // 将学生节点添加到根节点下
    document.getRootElement().add(student);    // 更新xml文件,直接输出会出现中文乱码,要用OutputFormat
    OutputFormat output = OutputFormat.createPrettyPrint();    // 设置输出的编码为utf-8
    output.setEncoding("utf-8");    // 这里一定要用FileOutputStream字节流输出,不能用FileWriter,否则还会有乱码
    XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/dom4j/test/myClass.xml"), output);
    xmlWriter.write(document);
    xmlWriter.close();
}

將學生新增到XML文件中,也需要在最後將記憶體中的Document物件寫入對應的文件,不然所有的動作只是在記憶體中進行,並不會輸出到文件中,這與DOM類似。
我們依然可以將這段更新的程式碼單獨寫成一個方法,如下:

public static void update(Document document) throws Exception {    // 更新xml文件,直接输出会出现中文乱码,要用OutputFormat
    OutputFormat output = OutputFormat.createPrettyPrint();    // 设置输出的编码为utf-8
    output.setEncoding("utf-8");
    XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/dom4j/test/myClass.xml"), output);
    xmlWriter.write(document);
    xmlWriter.close();
}

#【3】新增一個元素到指定位置

public static void addByIndex(Document document) throws Exception {    // 创建一个元素
    Element newStu = DocumentHelper.createElement("学生");
    newStu.setText("王小明");    // 得到所有学生的list
    List allStudent = document.getRootElement().elements("学生");
    allStudent.add(1, newStu);
    update(document);
}

這裡其實是直接在得到的List中添加,然後更新即可。這裡的List就是java.util套件中的List


#【4】刪除一個元素或刪除這個元素的屬性
刪除一個元素與DOM類似,都是透過對應的父節點刪除該節點。比方說我們要刪除第一個學生節點:

public static void delete(Document document) throws Exception {    // 找到该元素
    Element student = document.getRootElement().element("学生");    // 删除元素的某个属性
    student.remove(student.attribute("地址"));    // 通过父节点删除节点
    student.getParent().remove(student);
    update(document);
}

【5】更新元素
例如我們要把所有學生的年齡加1,並且將所有學生的地址屬性改為美國:

public static void updateAgeAndAddress(Document document) throws Exception {
Element root = document.getRootElement();
    List<Element> list = root.elements();    for (Element element : list) {        // 更新属性
        element.addAttribute("地址", "美国");        // 更新年龄子节点的值
        Element e_age = element.element("年龄");        int age = Integer.parseInt(e_age.getTextTrim());
        e_age.setText(String.valueOf(age + 1));
    }
    update(document);
}

首先為什麼會有Dom4j呢?

因為DOM太耗內存,而SAX只能對XML進行讀取,而不能去新增、刪除等。所以出現了Dom4j,它的效率更高,同時也可以進行crud操作。

1.DOM4J介紹

  • #Dom4j是一個簡單、靈活地開放原始碼的函式庫。 Dom4j是由早期開發JDOM的人分離出來而後獨立開發的。與JDOM不同的是,dom4j使用介面和抽象基類,雖然Dom4j的API相對要複雜一些,但它提供了比JDOM更好的靈活性。

  • Dom4j是一個非常優秀的Java XML API,具有效能優異、功能強大和極易使用的特點。現在很多軟體採用的Dom4j,例如Hibernate,包括Sun公司自己的JAXP也用了Dom4j。

  • 使用Dom4j開發,需下載dom4j對應的jar文件,並匯入到專案。下載地址dom4j下載

2.DOM4J案例

依然使用我們先前的XML檔:

<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>

該文件放在com.dom4j.test套件中。

使用DOM4J也要取得代表整個文件Document對象,不過這個Document對像是org.dom4j套件中的。

在主方法中取得Document物件如下:

// 1.得到一个解析器SAXReader saxReader = new SAXReader();
// 2.指定解析哪个XML文件Document document = saxReader.read(new File("src/com/dom4j/test/myClass.xml"));

然後我們就可以根據需求來寫對應的方法,在主方法中呼叫。

【1】指定讀取某個元素(讀取第一個學生的資訊)

public static void read(Document document) {    // 得到根元素
    Element root = document.getRootElement();    // root.elements("学生"):表示取出root下的所有学生元素
    // root.element("学生"):表示取出root下的第一个学生元素
    Element student = root.element("学生");    // 取出属性
    String address = student.attributeValue("地址");    // 取出各个子节点的值
    String name = student.element("名字").getText();
    String age = student.element("年龄").getText();
    String intro = student.element("介绍").getText();

    System.out.println(address);
    System.out.println(name);
    System.out.println(age);
    System.out.println(intro);
}

【2】新增元素:新增一個學生資訊到XML文件中

public static void add(Document document) throws Exception {    // 首先我们来创建一个学生节点对象
    Element student = DocumentHelper.createElement("学生");
    Element name = DocumentHelper.createElement("名字");
    name.setText("小强");
    Element age = DocumentHelper.createElement("年龄");
    age.setText("22");
    Element intro = DocumentHelper.createElement("介绍");
    intro.setText("是一个三好学生");    // 把三个子元素加到student节点下
    student.add(name);
    student.add(age);
    student.add(intro);    // 为学生添加属性
    student.addAttribute("地址", "大理");    // 将学生节点添加到根节点下
    document.getRootElement().add(student);    // 更新xml文件,直接输出会出现中文乱码,要用OutputFormat
    OutputFormat output = OutputFormat.createPrettyPrint();    // 设置输出的编码为utf-8
    output.setEncoding("utf-8");    // 这里一定要用FileOutputStream字节流输出,不能用FileWriter,否则还会有乱码
    XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/dom4j/test/myClass.xml"), output);
    xmlWriter.write(document);
    xmlWriter.close();
}

將學生新增到XML文件中,也需要在最後將記憶體中的Document物件寫入對應的文件,不然所有的動作只是在記憶體中進行,並不會輸出到文件中,這與DOM類似。
我們依然可以將這段更新的程式碼單獨寫成一個方法,如下:

public static void update(Document document) throws Exception {    // 更新xml文件,直接输出会出现中文乱码,要用OutputFormat
    OutputFormat output = OutputFormat.createPrettyPrint();    // 设置输出的编码为utf-8
    output.setEncoding("utf-8");
    XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/dom4j/test/myClass.xml"), output);
    xmlWriter.write(document);
    xmlWriter.close();
}

#【3】新增一個元素到指定位置

public static void addByIndex(Document document) throws Exception {    // 创建一个元素
    Element newStu = DocumentHelper.createElement("学生");
    newStu.setText("王小明");    // 得到所有学生的list
    List allStudent = document.getRootElement().elements("学生");
    allStudent.add(1, newStu);
    update(document);
}

這裡其實是直接在得到的List中添加,然後更新即可。這裡的List就是java.util套件中的List


#【4】刪除一個元素或刪除這個元素的屬性
刪除一個元素與DOM類似,都是透過對應的父節點刪除該節點。比方說我們要刪除第一個學生節點:

public static void delete(Document document) throws Exception {    // 找到该元素
    Element student = document.getRootElement().element("学生");    // 删除元素的某个属性
    student.remove(student.attribute("地址"));    // 通过父节点删除节点
    student.getParent().remove(student);
    update(document);
}

【5】更新元素
例如我們要把所有學生的年齡加1,並且將所有學生的地址屬性改為美國:

public static void updateAgeAndAddress(Document document) throws Exception {
Element root = document.getRootElement();
    List<Element> list = root.elements();    for (Element element : list) {        // 更新属性
        element.addAttribute("地址", "美国");        // 更新年龄子节点的值
        Element e_age = element.element("年龄");        int age = Integer.parseInt(e_age.getTextTrim());
        e_age.setText(String.valueOf(age + 1));
    }
    update(document);
}

 以上就是XML—XML解析之DOM4J的内容,更多相关内容请关注PHP中文网(www.php.cn)!


陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
故障排除XML/RSS提要:常見的陷阱和專家解決方案故障排除XML/RSS提要:常見的陷阱和專家解決方案May 01, 2025 am 12:07 AM

XML/RSS訂閱源的處理涉及解析和優化,常見問題包括格式錯誤、編碼問題和元素缺失。解決方案包括:1.使用XML驗證工具檢查格式錯誤;2.確保編碼一致性並使用chardet庫檢測編碼;3.處理元素缺失時使用默認值或跳過該元素;4.使用高效解析器如lxml和緩存解析結果以優化性能;5.注意數據一致性和安全性,防止XML注入攻擊。

解碼RSS文檔:閱讀和解釋提要解碼RSS文檔:閱讀和解釋提要Apr 30, 2025 am 12:02 AM

解析RSS文檔的步驟包括:1.讀取XML文件,2.使用DOM或SAX解析XML,3.提取標題、鏈接等信息,4.處理數據。 RSS文檔是一種基於XML的格式,用於發布更新內容,結構包含、和元素,適用於構建RSS閱讀器或數據處理工具。

RSS和XML:Web聯合組織的基石RSS和XML:Web聯合組織的基石Apr 29, 2025 am 12:22 AM

RSS和XML是網絡內容分發和數據交換的核心技術。 RSS用於發布頻繁更新的內容,XML用於存儲和傳輸數據。通過實際項目中的使用示例和最佳實踐,可以提高開發效率和性能。

RSS提要:探索XML的作用和目的RSS提要:探索XML的作用和目的Apr 28, 2025 am 12:06 AM

XML在RSSFeed中的作用是結構化數據、標準化和提供可擴展性。 1.XML使得RSSFeed的數據結構化,便於解析和處理。 2.XML提供了一種標準化的方式來定義RSSFeed的格式。 3.XML的可擴展性使得RSSFeed可以根據需要添加新的標籤和屬性。

縮放XML/RSS處理:性能優化技術縮放XML/RSS處理:性能優化技術Apr 27, 2025 am 12:28 AM

處理XML和RSS數據時,可以通過以下步驟優化性能:1)使用高效的解析器如lxml提升解析速度;2)採用SAX解析器減少內存使用;3)利用XPath表達式提高數據提取效率;4)實施多進程並行處理提升處理速度。

RSS文檔格式:探索RSS 2.0及以後RSS文檔格式:探索RSS 2.0及以後Apr 26, 2025 am 12:22 AM

RSS2.0是一種開放標準,允許內容髮布者以結構化的方式分發內容。它包含了豐富的元數據,如標題、鏈接、描述、發布日期等,使得訂閱者能夠快速瀏覽和訪問內容。 RSS2.0的優勢在於其簡潔和擴展性。例如,它允許自定義元素,這意味著開發者可以根據需求添加額外的信息,如作者、分類等。

理解RSS:XML觀點理解RSS:XML觀點Apr 25, 2025 am 12:14 AM

RSS是一種基於XML的格式,用於發布經常更新的內容。 1.RSSfeed通過XML結構化組織信息,包括標題、鏈接、描述等。 2.創建RSSfeed需按照XML結構編寫,添加元數據如語言和發布日期。 3.高級用法可包含多媒體文件和分類信息。 4.調試時使用XML驗證工具,確保必需元素存在且編碼正確。 5.優化RSSfeed可通過分頁、緩存和保持結構簡潔來實現。通過理解和應用這些知識,可以有效管理和分發內容。

XML中的RSS:解碼標籤,屬性和結構XML中的RSS:解碼標籤,屬性和結構Apr 24, 2025 am 12:09 AM

RSS是一種基於XML的格式,用於發布和訂閱內容。 RSS文件的XML結構包括根元素、元素和多個元素,每個代表一個內容條目。通過XML解析器讀取和解析RSS文件,用戶可以訂閱並獲取最新內容。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境