XML解析之DOM4J解析的示例代码-XML/RSS教程-PHP中文网

首页

后端开发

XML/RSS教程

XML解析之DOM4J解析的示例代码

黄舟

Mar 18, 2017 pm 05:00 PM

前言：公司的APP很早就有了，之前的接口结果处理都是通过XML的方式，并且在项目中，每个人处理XML的方式各种各样，没有统一的处理方式，所以在运用中很苦恼，所以楼主每次在项目开发中，为了节省自己的时间，不在研究其他人员XML的解析方式，只要遇到XML的地方，楼主就用DOM4J的方式解析。

关于XML的解析方式有好多种，DOM、SAX、JDOM等等，至于用法和原理这里就不在说了（ps:楼主也不知道用法和原理）。这篇文章主要说说DOM4J的简单操作和用法。

DOM4J介绍

dom4j是一个Java的XML API，是jdom的升级品，用来读写XML文件的。dom4j是一个十分优秀的JavaXML API，具有性能优异、功能强大和极其易使用的特点，它的性能超过sun公司官方的dom技术，同时它也是一个开放源代码的软件，可以在SourceForge上找到它。

Dom4j是一个易用的、开源的库，用于XML，XPath和XSLT。它应用于Java平台，采用了Java集合框架并完全支持DOM，SAX和JAXP。

这里用一个简单的例子来介绍DOM4J的用法。

注意：使用DOM4J解析XML，需要在项目中引入DOM4J的jar包

XML文件

<Response T=&#39;203&#39; T1=&#39;6&#39; TaskID=&#39;20130800001963&#39; MediaNum=&#39;3&#39; Result = &#39;1&#39; Desc=&#39;查询成功!&#39; >
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;1&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片1</Media>
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;2&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片2</Media>
    <Media Name=&#39;IMG_20130425_141838.jpg&#39; Mediasource =&#39;3&#39; Type =&#39;1&#39; Code=&#39;/9j/4AAQSkZJRgABAQA0&#39;>图片3</Media>
</Response>

DOM4J使用详解
步骤1：加载xml文件

加载xml可以分为主要的两种方式

1、直接加载文件所在的路径地址

2、加载字符串形式的xml(此方式主要是用在服务器返回结果中)

1.1、直接加载文件路径

   SAXReader reader = new SAXReader();
        Document document = null;
        try {
            document = reader.read(new File("E://CZBK//day01//caseUp.xml"));
        } catch (DocumentException e) {
            e.printStackTrace();
        }

1.2、加载字符串形式的xml

SAXReader reader = new SAXReader();
    Document document = null;
    try {
        //result是需要解析的字符串 
        //解析字符串需要转换成流的形式，可以指定转换字符编码
        document = reader.read(new ByteArrayInputStream(result.getBytes("UTF-8")));
    } catch (DocumentException  e) {
        e.printStackTrace();
    }

步骤2：解析XML

在解析XML之前，我们先来介绍下XML的结构称呼，清楚下面4个问题对解析XML很有帮助

什么是节点(node)？什么是元素(element)？什么是属性(attribute)？什么是文本值(value)？

节点：“Response”、“Media”这些称之为节点

元素：以一个完整的标签结束称之为元素，包含整个元素内容。例如：d0d86acc29df8ad87168fa20058eae99图片1

属性：节点的属性值，对节点内容加之说明。例如：T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='查询成功!'

文本值：“图片1”称之为文本值。

在项目中无非就是围绕元素、属性和文本值进行操作，所以掌握好这三部分的取值方法，也就掌握了XML解析。

2.1、获取根节点

 //获取整个文档
        Element rootElement = document.getRootElement();

rootElement包含整个xml文档的内容，也就是Response标签包含的所有内容

2.2、获取Response节点的属性值

 //获取Response节点的Result属性值
        String responseResult = rootElement.attributeValue("Result");

2.3、获取Media元素

//获取第一个Media元素
        Element mediaElement = rootElement.element("Media");
        //获取所有的Media元素
        List allMeidaElements = rootElement.elements("Media");

2.4、获取Media属性值

 //获取第一个Media元素的Name属性值
        String mediaName = mediaElement.attributeValue("Name");
        //遍历所有的Media元素的Name属性值
        for (int i = 0; i < allMeidaElements.size(); i++) {
            Element element = (Element) allMeidaElements.get(i);
            String name = element.attributeValue("Name");
        }

2.5、获取Media标签的文本值

    //获取第一个Meida元素的文本值
        String value = mediaElement.getText();

完整代码

import java.io.File;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Textxml {
    public void xml() {
        SAXReader reader = new SAXReader();
        Document document = null;
        try {
            document = reader.read(new File("E://CZBK//day01//caseUp.xml"));
        } catch (DocumentException e) {
            e.printStackTrace();
        }
        //获取整个文档
        Element rootElement = document.getRootElement();
        System.out.println("整个文档:"+rootElement.asXML());
        //获取Response节点的Result属性值
        String responseResult = rootElement.attributeValue("Result");
        System.out.println("Response节点的Result属性值:"+responseResult);
        //获取第一个Media元素
        Element mediaElement = rootElement.element("Media");
        System.out.println("第一个Media元素:"+mediaElement.asXML());
        //获取所有的Media元素
        List allMeidaElements = rootElement.elements("Media");
        //获取第一个Media元素的Name属性值
        String mediaName = mediaElement.attributeValue("Name");
        System.out.println("第一个Media元素的Name属性值:"+mediaName);
        //遍历所有的Media元素的Name属性值
        for (int i = 0; i < allMeidaElements.size(); i++) {
            Element element = (Element) allMeidaElements.get(i);
            String name = element.attributeValue("Name");
        }
        //获取第一个Meida元素的文本值
        String value = mediaElement.getText();
        System.out.println("第一个Meida元素的文本值:"+value);
    }
    public static void main(String[] args) {
        Textxml textxml = new Textxml();
        textxml.xml();
    }
}

运行结果

整个文档:<Response T="203" T1="6" TaskID="20130800001963" MediaNum="3" Result="1" Desc="查询成功!">
<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
    <Media Name="IMG_20130425_141838.jpg" Mediasource="2" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片2</Media>
    <Media Name="IMG_20130425_141838.jpg" Mediasource="3" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片3</Media>
</Response>
Response节点的Result属性值:1
第一个Media元素:<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">图片1</Media>
第一个Media元素的Name属性值:IMG_20130425_141838.jpg
第一个Meida元素的文本值:图片1

后记

1、XML解析方式有很多中，未必每种都要掌握，把其中的一种解析弄清楚就够用了，至于性能上的差别楼主体会不出来，也不能解答这个问题

2、DOM4J的API有很多，这篇文章中只是介绍了最基本的最常用的几种，如果有兴趣可以自行研究使用

以上是XML解析之DOM4J解析的示例代码的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

缩放XML/RSS处理：性能优化技术Apr 27, 2025 am 12:28 AM

处理XML和RSS数据时，可以通过以下步骤优化性能：1)使用高效的解析器如lxml提升解析速度；2)采用SAX解析器减少内存使用；3)利用XPath表达式提高数据提取效率；4)实施多进程并行处理提升处理速度。

RSS文档格式：探索RSS 2.0及以后Apr 26, 2025 am 12:22 AM

RSS2.0是一种开放标准，允许内容发布者以结构化的方式分发内容。它包含了丰富的元数据，如标题、链接、描述、发布日期等，使得订阅者能够快速浏览和访问内容。RSS2.0的优势在于其简洁和扩展性。例如，它允许自定义元素，这意味着开发者可以根据需求添加额外的信息，如作者、分类等。

理解RSS：XML观点Apr 25, 2025 am 12:14 AM

RSS是一种基于XML的格式，用于发布经常更新的内容。1.RSSfeed通过XML结构化组织信息，包括标题、链接、描述等。2.创建RSSfeed需按照XML结构编写，添加元数据如语言和发布日期。3.高级用法可包含多媒体文件和分类信息。4.调试时使用XML验证工具，确保必需元素存在且编码正确。5.优化RSSfeed可通过分页、缓存和保持结构简洁来实现。通过理解和应用这些知识，可以有效管理和分发内容。

XML中的RSS：解码标签，属性和结构Apr 24, 2025 am 12:09 AM

RSS是一种基于XML的格式，用于发布和订阅内容。RSS文件的XML结构包括根元素、元素和多个元素，每个代表一个内容条目。通过XML解析器读取和解析RSS文件，用户可以订阅并获取最新内容。

XML在RSS中的优势：技术深度潜水Apr 23, 2025 am 12:02 AM

XML在RSS中具有结构化数据、可扩展性、跨平台兼容性和解析验证的优势。1）结构化数据确保内容的一致性和可靠性；2）可扩展性允许添加自定义标签以适应内容需求；3）跨平台兼容性使其在不同设备上无缝工作；4）解析和验证工具确保Feed的质量和完整性。

XML中的RSS：揭示内容联合的核心Apr 22, 2025 am 12:08 AM

RSS在XML中的实现方式是通过结构化的XML格式来组织内容。1)RSS使用XML作为数据交换格式，包含频道信息和项目列表等元素。2)生成RSS文件需按规范组织内容，发布到服务器供订阅。3)RSS文件可通过阅读器或插件订阅，实现内容自动更新。

超越基础：高级RSS文档功能Apr 21, 2025 am 12:03 AM

RSS的高级功能包括内容命名空间、扩展模块和条件订阅。1）内容命名空间扩展RSS功能，2）扩展模块如DublinCore或iTunes添加元数据，3）条件订阅根据特定条件筛选条目。这些功能通过添加XML元素和属性实现，提升信息获取效率。

XML主链：RSS提要如何结构Apr 20, 2025 am 12:02 AM

rssfeedsusexmltoStructureContentUpdates.1）xmlProvidesHierarchicalStructurefordata.2）theelementDefinestHefEed'sIdentityAndContainsElements.3）ElementsRementsRementsRepresSentividividividualContentpieces.4）rsssissisexisextensible，允许custemements.5）5）

See all articles