XML/RSS教程

XML编程-DOM4J

黄舟

Feb 20, 2017 pm 03:13 PM

XML编程-DOM4J

基本概述

dom4j是一个Java的XML API，类似于jdom，用来读写XML文件的。dom4j是一个十分优秀的JavaXML API，具有性能优异、功能强大和极其易使用的特点，同时它也是一个开放源代码的软件，可以在SourceForge上找到它。在IBM developerWorks上面还可以找到一篇文章，对主流的Java XML API进行的性能、功能和易用性的评测，所以可以知道dom4j无论在哪个方面都是非常出色的。如今可以看到越来越多的Java软件都在使用dom4j来读写XML，特别值得一提的是连Sun的JAXM也在用dom4j。这已经是必须使用的jar包， Hibernate也用它来读写配置文件。

PS：DOM4J功能那么强大的原因之一就是它支持XPath技术，DOM4J也有相应的参考文档，需要的可以自行搜索下载。

为什么会有DOM4J？

之前，博客里阐述的两门技术，DOM和SAX技术，前者的缺点是耗费内存，后者的缺点是只能进行读取操作，而DOM4J既可以提交效率，也可以进行crud操作。

PS：使用DOM4J需要导入相应基本JAR包，如果使用DOM4J的扩展功能，还需要导入扩展JAR包。

DOM4J使用入门

DOM4J获得Document对象的三种方法

1.读取XML文件,获得document对象(常用)

    SAXReader reader = new SAXReader();
    Document   document = reader.read(new File(“src/input.xml"));

2.解析XML形式的文本,得到document对象

    String text = "<members></members>";
    Document document = DocumentHelper.parseText(text);

3.主动创建document对象

    Document document = DocumentHelper.createDocument();
    //创建根节点
    Element root = document.addElement("members");

PS：注意要导入相应JAR包。

节点对象

1、获取文档的根节点

    Element root = document.getRootElement();

2、取得某个节点的子节点

    Element element=node.element(“书名");

3、取得节点的内容

    String text1=node.getText();
    String text2=node.getTextTrim();	// 去掉内容前面和后面的空格

4、取得某节点下所有名为“member”的子节点，并进行遍历

    List nodes = rootElm.elements("member");
    for (Iterator it = nodes.iterator(); it.hasNext();) {
          Element elm = (Element) it.next();
          // do something
    }

5、对某节点下的所有子节点进行遍历

    for(Iterator it=root.elementIterator();it.hasNext();){
        Element element = (Element) it.next();
           // do something
      }

6、在某节点下添加子节点

    Element ageElm = newMemberElm.addElement("age");

7、设置节点文字

    element.setText("29");

8、删除某节点

    //childElm是待删除的节点,parentElm是其父节点
    parentElm.remove(childElm);

9、添加一个CDATA节点

    Element contentElm = infoElm.addElement("content");
    contentElm.addCDATA(diary.getContent());

PS：注意不能跨层访问节点。

节点对象属性

1、取得某节点下的某属性

    Element root=document.getRootElement();    
      //属性名name
    Attribute attribute=root.attribute("size");

2、取得属性的文字

     String text=attribute.getText();

3、删除某属性

    Attribute attribute=root.attribute("size");
    root.remove(attribute);

4、遍历某节点的所有属性

     Element root=document.getRootElement();    
    for(Iterator it=root.attributeIterator();it.hasNext();){
           Attribute attribute = (Attribute) it.next();
           String text=attribute.getText();
            System.out.println(text);
     }

5、设置某节点的属性和文字

    newMemberElm.addAttribute("name", "sitinspring");

6、设置属性的文字

    Attribute attribute=root.attribute("name");
     attribute.setText("sitinspring");

在指定位置插入节点

1.得到插入位置的节点列表（list）

2.调用list.add(index,elemnent)，由index决定element的插入位置。

Element元素可以通过DocumentHelper对象得到。示例代码：

    Element aaa = DocumentHelper.createElement("aaa");
    aaa.setText("aaa");
    List list = root.element("书").elements();
    list.add(1, aaa);
    //更新document

将文档写入XML文件

1、如果文档是全英文

XMLWriter writer = new XMLWriter(new  FileWriter("output.xml"));
writer.write(document);
writer.close();

2、如果文档含有中文

OutputFormat outputFormat = OutputFormat.createPrettyPrint();
outputFormat.setEncoding("utf-8");

XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/pc/XML8.xml"), outputFormat);
xmlWriter.write(document);
xmlWriter.close();

PS：出现乱码的原因是因为输出字符集不能识别中文，这样可以通过OutputFormat的setEncoding方法设置为”UTF-8”，然后再使用XMLWriter这种形参的(OutputStream out, OutputFormat format) 构造方构造方法，就能解决乱码问题了，至于为什么会用createPrettyPrint方法，是因为这样做输出的格式更符合人的阅读习惯。

综合案例

XML8.xml

<?xml version="1.0" encoding="utf-8"?>
<班级 班次="1班" 编号="C1">
	<学生 学号="n1" 性别="男" 授课方式="面授" 朋友="n2" 班级编号="C1">
		<名字>张三</名字>
		<年龄>20</年龄>
		<介绍>不错</介绍>
	</学生>
	<学生 学号="n2" 性别="女" 授课方式="面授" 朋友="n1 n3" 班级编号="C1">
		<名字>李四</名字>
		<年龄>18</年龄>
		<介绍>很好</介绍>
	</学生>
	<学生 学号="n3" 性别="男" 授课方式="面授" 朋友="n2" 班级编号="C1">
		<名字>王五</名字>
		<年龄>22</年龄>
		<介绍>非常好</介绍>
	</学生>
	<学生 性别="男" 班级编号="C1">
		<名字>小明</名字>
		<年龄>30</年龄>
		<介绍>好</介绍>
	</学生>
</班级>

package com.pc;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.util.Iterator;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
/**
 * 
 * @author Switch
 * @function 使用DOM4j解析XML文件
 * 
 */
public class XML8 {
	// 使用DOM4j对XML进行CRUD操作
	public static void main(String[] args) throws Exception {
		// 1.得到解析器
		SAXReader saxReader = new SAXReader();
		// 2.指定解析哪个XML文件
		Document document = saxReader.read(new File("src/com/pc/XML8.xml"));
		// list(document.getRootElement());
		// read(document);
		// readByXPath(document);
		// add(document);
		// delete(document);
		// updateElement(document);
		// updateAttribute(document);
		// addByIndex(document, 3);
	}

	// 更新属性(修改所有班级编号为C2)
	public static void updateAttribute(Document document) throws Exception {
		// 得到所有学生
		List<Element> students = document.getRootElement().elements("学生");
		for (Element e : students) {
			// 修改班级编号
			e.addAttribute("班级编号", "C2");
		}
		updateToXML(document);
	}

	// 更新元素(将所有学生的年龄+3)
	public static void updateElement(Document document) throws Exception {
		// 得到所有学生
		List<Element> students = document.getRootElement().elements("学生");
		for (Element e : students) {
			// 取出年龄
			Element age = e.element("年龄");
			age.setText(Integer.parseInt(age.getTextTrim()) + 3 + "");
		}
		updateToXML(document);
	}

	// 删除元素(删除第一个学生)
	public static void delete(Document document) throws Exception {
		// 找到元素
		Element stu = document.getRootElement().element("学生");
		// 删除
		stu.getParent().remove(stu);

		// 更新
		updateToXML(document);
	}

	// 添加元素到指定位置
	public static void addByIndex(Document document, int index)
			throws Exception {
		// 创建一个元素
		Element newStu = DocumentHelper.createElement("学生");
		newStu.setText("小花");
		// 得到所有学生的list
		List<Element> students = document.getRootElement().elements("学生");
		// 按索引添加
		students.add(index, newStu);

		// 更新
		updateToXML(document);
	}

	// 添加元素(添加一个学生到xml中)
	public static void add(Document document) throws Exception {
		// 创建一个学生节点对象

		Element newStu = DocumentHelper.createElement("学生");
		// 给元素添加属性
		newStu.addAttribute("学号", "n4");
		Element newStuName = DocumentHelper.createElement("名字");
		Element newStuAge = DocumentHelper.createElement("年龄");
		Element newStuIntro = DocumentHelper.createElement("介绍");

		// 把子元素挂载到学生节点下
		newStu.add(newStuName);
		newStu.add(newStuAge);
		newStu.add(newStuIntro);
		// 将学生挂载在根节点下
		document.getRootElement().add(newStu);

		// 更新
		updateToXML(document);
	}

	private static void updateToXML(Document document)
			throws UnsupportedEncodingException, FileNotFoundException,
			IOException {
		// 更新xml文件
		// 直接输出会出现中文乱码
		OutputFormat outputFormat = OutputFormat.createPrettyPrint();
		outputFormat.setEncoding("utf-8");

		XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(
				"src/com/pc/XML8.xml"), outputFormat);
		xmlWriter.write(document);
		xmlWriter.close();
	}

	// xpath技术，跨层读取某个元素
	public static void readByXPath(Document document) throws Exception {
		// 取出第一个学生
		Element student = (Element) document.selectSingleNode("/班级/学生[1]");
		System.out.println("姓名：" + student.elementText("名字") + "\t年龄："
				+ student.elementText("年龄") + "\t介绍："
				+ student.elementText("介绍") + "\t性别："
				+ student.attributeValue("性别"));
	}

	// 读取指定的某个元素(读取第一个学生的信息)
	public static void read(Document document) throws Exception {
		// 得到根元素
		Element root = document.getRootElement();
		// root.elements("学生"); 取出root元素下的所有学生元素
		// root.element("学生"); 取出root元素下的第一个学生元素
		// 取出root元素下的第一个学生元素
		Element student = (Element) root.elements("学生").get(0);
		System.out.println("姓名：" + student.elementText("名字") + "\t年龄："
				+ student.elementText("年龄") + "\t介绍："
				+ student.elementText("介绍") + "\t性别："
				+ student.attributeValue("性别"));
	}

	// 遍历xml文件
	public static void list(Element element) {
		System.out.println("元素名称：" + element.getName() + "\t元素内容："
				+ element.getTextTrim());

		Iterator<Element> iterator = element.elementIterator();

		while (iterator.hasNext()) {
			Element e = iterator.next();
			// 递归
			list(e);
		}
	}
}

以上就是XML编程-DOM4J的内容，更多相关内容请关注PHP中文网（www.php.cn）！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

XML中的RSS：解码标签，属性和结构Apr 24, 2025 am 12:09 AM

RSS是一种基于XML的格式，用于发布和订阅内容。RSS文件的XML结构包括根元素、元素和多个元素，每个代表一个内容条目。通过XML解析器读取和解析RSS文件，用户可以订阅并获取最新内容。

XML在RSS中的优势：技术深度潜水Apr 23, 2025 am 12:02 AM

XML在RSS中具有结构化数据、可扩展性、跨平台兼容性和解析验证的优势。1）结构化数据确保内容的一致性和可靠性；2）可扩展性允许添加自定义标签以适应内容需求；3）跨平台兼容性使其在不同设备上无缝工作；4）解析和验证工具确保Feed的质量和完整性。

XML中的RSS：揭示内容联合的核心Apr 22, 2025 am 12:08 AM

RSS在XML中的实现方式是通过结构化的XML格式来组织内容。1)RSS使用XML作为数据交换格式，包含频道信息和项目列表等元素。2)生成RSS文件需按规范组织内容，发布到服务器供订阅。3)RSS文件可通过阅读器或插件订阅，实现内容自动更新。

超越基础：高级RSS文档功能Apr 21, 2025 am 12:03 AM

RSS的高级功能包括内容命名空间、扩展模块和条件订阅。1）内容命名空间扩展RSS功能，2）扩展模块如DublinCore或iTunes添加元数据，3）条件订阅根据特定条件筛选条目。这些功能通过添加XML元素和属性实现，提升信息获取效率。

XML主链：RSS提要如何结构Apr 20, 2025 am 12:02 AM

rssfeedsusexmltoStructureContentUpdates.1）xmlProvidesHierarchicalStructurefordata.2）theelementDefinestHefEed'sIdentityAndContainsElements.3）ElementsRementsRementsRepresSentividividividualContentpieces.4）rsssissisexisextensible，允许custemements.5）5）