詳解XML- JAXP技術-DOM解析-XML/RSS教程-PHP中文網

首頁

後端開發

XML/RSS教程

詳解XML- JAXP技術-DOM解析

黄舟

Mar 31, 2017 pm 02:12 PM

　　DOM解析的基本思路：

　　　　1、将整个XML文件一次性读入内存

　　　　2、将整个XML看做一棵树

　　　　3、XML中的每一个标签，属性，文本都看做是树上的一个结点

　　　　4、然后可以对结点进行增删改查的操作

　　话不多说，上代码。

　　1、首先我在D:\ABC中新建了一个文本文件，重命名为stus.xml，以下是文件中的内容

<?xml version = "1.0" encoding = "GBK" ?>
　　　　<stus class = "S160401A">
　　　　<stu num = "001" >
　　　　<name>张三</name>
　　　　<age>20</age>
　　　　<sex>男</sex>
　　　　</stu>
 
　　　　<stu num = "002">
　　　　<name>李四</name>
　　　　<age>21</age>
　　　　<sex>女</sex>
　　　　</stu>
 
　　　　<stu num = "003">
　　　　<name>王五</name>
　　　　<age>22</age>
　　　　<sex>男</sex>
　　　　</stu>
　　　　</stus>

　在第一行是XML声明，version表示版本号，encoding表示编码方式，微软的记事本用的是国标的编码方式，如果要用UTF-8，则要在另存为窗口中修改编码方式为UTF-8。

詳解XML- JAXP技術-DOM解析

　必须且只能有一对根标签，我写的根标签是。其他的就不多说了。

2、这是一个学生类，定义了一些属性和get、set方法

<span style="font-size: 16px;">public class Student {
	public static String Class;
	private String name;
	private int num;
	private int age;
	private char sex;

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getNum() {
		return num;
	}

	public void setNum(int num) {
		this.num = num;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	public char getSex() {
		return sex;
	}

	public void setSex(char sex) {
		this.sex = sex;
	}

}</span>

　　3、这是用DOM解析的类，看这个类之前还要了解一下。

　　　　DocumentBuilderFactory　DOM解析器工厂

　　　　DocumentBuilder　DOM解析器

　　　　Document　文档对象

　　　　Node　结点【接口】

　　　　Element　元素结点【标签结点】

　　　　Attr　属性结点

　　　　Text　文本结点

　　　　Node 是Document，Element,Attr,Text的父接口

　　　　NodeList 结点列表

　　　　NamedNodeMap 一个结点的所有属性

<span style="font-size: 16px;">import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import bean.Student;

public class DOMParser {

	public static void main(String[] args) throws Exception {

		// 得到解析器工厂对象
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

		// 生产一个解析器对象
		DocumentBuilder builder = factory.newDocumentBuilder();

		// 开始解析XML文件,得到解析的结果，是一个Document对象
		// Document对象叫做文档树对象
		Document dom = builder.parse("D:\\ABC\\stus.xml");

		// 通过Document对象提取数据
		// Document对象的第一个子节点是根节点[根标签]
		Node root = dom.getFirstChild();
		// 获得标签的名字
		String str = root.getNodeName();
		// 获得根节点的属性
		NamedNodeMap attrs = root.getAttributes();
		// 强转成Attr类型 属性类
		Attr attr = (Attr) attrs.getNamedItem("class");
		// 获得属性里的值
		String v = attr.getValue();
		System.out.println(v);

		// 获得所有的学生-------------------------------------
		NodeList list = root.getChildNodes();
		for (int i = 0; i < list.getLength(); i++) {
			Node node = list.item(i);
			// 判断是否是标签结点
			if (node instanceof Element) {
				Element e = (Element) node;
				// 获得标签结点里属性的值
				String num = e.getAttribute("num");
				System.out.println(num);

				// 输出标签中的文本
				// System.out.println(e.getTextContent());

				// 继续获得stu的子节点
				NodeList nodeList = e.getChildNodes();
				for (int j = 0; j < nodeList.getLength(); j++) {
					Node n = nodeList.item(j);
					if (n instanceof Element) {
						Element ele = (Element) n;
						// 获得元素结点的标签名字
						String nodeName = ele.getNodeName();
						// 获得元素结点标签中的文本
						String value = ele.getTextContent();
						if (nodeName.equals("name")) {
							System.out.println("姓名:" + value);
						} else if (nodeName.equals("age")) {
							System.out.println("年龄：" + value);
						} else if (nodeName.equals("sex")) {
							System.out.println("性别：" + value);
						}
					}
				}
			}
		}
	}
}</span>

　　自己在其中总结了一些方法：

　　DocumentBuilderFactory类：

　public static DocumentBuilderFactory newInstance();　//得到解析器工厂对象
　　　　public abstract DocumentBuilder newDocumentBuilder();　//生产一个解析器对象

　　DocumentBuilder类：

　　　　public Document parse(String uri);　//解析路径为uri的XML文件,得到解析的结果是一个Document对象

　　Node类：

　public Node getFirstChild();　//得到Document对象的第一个子结点，也就是根结点、或者叫根标签，在上面的代码中得到的是stus，看上面的第1点中的XML文件的内容。
　　　　public NamedNodeMap getAttributes();//获得结点的属性
　　　　public NodeList getChildNodes();//获得所有子结点
　　　　public String getNodeName();//获得标签的名字 
　　　　public String getTextContent() throws DOMException;//获得标签结点中的文本

　　NamedNodeMap类：　　　　

　　　　public Node getNamedItem(String name);//返回所有名字为name的结点

　　Attr类：

　　　　public String getValue();//获得属性里的值

　　NodeList类：

　　　　public Node item(int index);//返回第index个结点

　　Element类：

　　　　public String getAttribute(String name);//获得标签结点里属性name的值

以上是詳解XML- JAXP技術-DOM解析的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

RSS，XML和現代網絡：內容聯合深度潛水May 08, 2025 am 12:14 AM

RSS和XML在現代Web中依然重要。 1.RSS用於發布和分發內容，用戶可通過RSS閱讀器訂閱並獲取更新。 2.XML作為標記語言，支持數據存儲和交換，RSS文件基於XML。

基礎知識超越：XML啟用的高級RSS功能May 07, 2025 am 12:12 AM

RSS可以實現多媒體內容嵌入、條件訂閱、以及性能和安全性優化。 1)通過標籤嵌入多媒體內容，如音頻和視頻。 2)使用XML命名空間實現條件訂閱，允許訂閱者根據特定條件篩選內容。 3)通過CDATA節和XMLSchema優化RSSFeed的性能和安全性，確保穩定性和符合標準。

解碼RSS：Web開發人員的XML底漆May 06, 2025 am 12:05 AM

RSS是一種基於XML的格式，用於發布常更新的數據。作為Web開發者，理解RSS能提升內容聚合和自動化更新能力。通過學習RSS結構、解析和生成方法，你將能自信地處理RSSfeeds，優化Web開發技能。

JSON與XML：為什麼RSS選擇XMLMay 05, 2025 am 12:01 AM

RSS選擇XML而不是JSON是因為：1)XML的結構化和驗證能力優於JSON，適合RSS複雜數據結構的需求；2)XML當時有廣泛的工具支持；3)RSS早期版本基於XML，已成標準。

RSS：基於XML的格式解釋了May 04, 2025 am 12:05 AM

RSS是一種基於XML的格式，用於訂閱和閱讀頻繁更新的內容。它的工作原理包括生成和消費兩部分，使用RSS閱讀器可以高效獲取信息。

在RSS文檔中：必需XML標籤和屬性May 03, 2025 am 12:12 AM

RSS文檔的核心結構包括XML標籤和屬性，具體解析和生成步驟如下：1.讀取XML文件，處理和標籤。 2.提取、、等標籤信息。 3.處理自定義標籤和屬性，確保版本兼容性。 4.使用緩存和異步處理優化性能，確保代碼可讀性。

JSON，XML和數據格式：比較RSSMay 02, 2025 am 12:20 AM

JSON、XML和RSS的主要區別在於結構和用途：1.JSON適用於簡單數據交換，結構簡潔，易於解析；2.XML適合複雜數據結構，結構嚴謹但解析複雜；3.RSS基於XML，用於內容髮布，標準化但用途有限。

故障排除XML/RSS提要：常見的陷阱和專家解決方案May 01, 2025 am 12:07 AM

XML/RSS訂閱源的處理涉及解析和優化，常見問題包括格式錯誤、編碼問題和元素缺失。解決方案包括：1.使用XML驗證工具檢查格式錯誤；2.確保編碼一致性並使用chardet庫檢測編碼；3.處理元素缺失時使用默認值或跳過該元素；4.使用高效解析器如lxml和緩存解析結果以優化性能；5.注意數據一致性和安全性，防止XML注入攻擊。

See all articles