XML/RSS教程

XML—XML解析之SAX

黄舟

Feb 24, 2017 pm 03:06 PM

1.SAX解析

在使用DOM解析XML文档时，需要读取整个XML文档，在内存中构建整个DOM树的Document对象，从而再对XML文档进行操作。此种情况下，如果XML文档特别大，就会消耗计算机的大量内存，严重的情况下可能还会导致内存溢出。
SAX解析允许在读取文档的时候，即对文档进行处理，而不必等到整个文档装载完才对文档进行操作。
通过继承DefaultHandler，来开发一个SAX解析器

【注意】SAX主要用于对XML文档的解析，不能去修改、删除和添加元素。

1.1.SAX解析机制

sax是一种推式的机制，你创建一个sax解析器，解析器在发现xml文档中的内容时就告诉你（把事件推给你，有点类似于java swing中的事件监听）。如何处理这些发现的内容，由程序员自己决定。

在基于sax的程序中，有五个最常用的sax事件：

1.startDocument()–>告诉你解析器发现了文档的开始，告诉你解析器开始扫描文档
2.endDocument()–>告诉你解析器发现了文档结尾
3.startElement()–>告诉你解析器发现了一个起始标签，该事件告诉你标签的名称、该元素所有的属性名和值
4.characters()–>告诉你解析器发现了一些文本，将得到一个字符数组，该数组的偏移量和一个长度偏移量，有这三个变量你可以得到解析器发现的文本
5.endElement()–>告诉你解析器发现了一个结束标签，该事件告诉你元素的名称

1.2.SAX解析实例

依然使用DOM解析中用到的XML例子，如下：

<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>

【步骤】：

1.使用SAXParserFactory创建SAX解析工厂

SAXParserFactory spf = SAXParserFactory.newInstance();

2.通过SAX解析工厂得到解析器对象

SAXParser sp = spf.newSAXParser();

3.将解析对象和事件处理器对象关联

sp.parse("src/myClass.xml",new MyHandler());

这里的MyHandler需要自己定义，并且它要继承DefaultHandler，然后在MyHandler类中重写上文提到的5个sax事件方法，当然也可以只重写自己需要的。
比如现在我写的MyHandler如下：

class MyHandler extends DefaultHandler{    /**
     * 发现文档开始，该函数只会被调用一次
     */
    @Override
    public void startDocument() throws SAXException {
        System.out.println("startDocument");
    }    /**
     * 发现文档结束，该函数只会被调用一次
     */
    @Override
    public void endDocument() throws SAXException {
        System.out.println("endDocument");
    }    /**
     * 发现XML中的一个元素开始，会被反复调用
     */
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        System.out.println("元素名称："+qName);
    }    /**
     * 发现XML中的一个元素结束，会被反复调用
     */
    @Override
    public void endElement(String uri, String localName, String qName)            
    throws SAXException {

    }    /**
     * 发现XML文件中的文本，会被反复调用
     */
    @Override
    public void characters(char[] ch, int start, int length)            
    throws SAXException {        // 显示文本内容
        String text = new String(ch,start,length);        if(!text.trim().equals("")){
            System.out.println(text);
        }
    }
}

运行结果如下：

运行结果1

可以看到，这是对XML文档的一种遍历，而sax能够做的也只是遍历了。

那么，如果现在我们有这样一个需求：只显示所有学生的姓名和年龄，不显示学生的介绍，怎么实现呢？

我们可以在MyHandler类中定义两个布尔变量isName和isAge，在startElement方法中标识是否是姓名元素或者年龄元素，如果是的话才在characters方法中获取对应的文本，如下：

1.定义两个布尔变量

private boolean isName = false;private boolean isAge = false;

2.在startElement方法中添加判断

@Overridepublic void startElement(String uri, String localName, String qName,
        Attributes attributes) throws SAXException {    if(qName.equals("名字")){        this.isName = true;
    }else if(qName.equals("年龄")){        this.isAge = true;
    }
}

3.在characters方法中根据标识符进行判断是否获取文本

@Overridepublic void characters(char[] ch, int start, int length)        throws SAXException {    // 显示文本内容
    String text = new String(ch,start,length);    if(!text.trim().equals("")&&(isName||isAge)){
        System.out.println(text);
    }
    isName = false;
    isAge = false;
}

最后要记得将两个布尔变量复位成false。
运行结果如下：

运行结果2

1.SAX解析

在使用DOM解析XML文档时，需要读取整个XML文档，在内存中构建整个DOM树的Document对象，从而再对XML文档进行操作。此种情况下，如果XML文档特别大，就会消耗计算机的大量内存，严重的情况下可能还会导致内存溢出。
SAX解析允许在读取文档的时候，即对文档进行处理，而不必等到整个文档装载完才对文档进行操作。
通过继承DefaultHandler，来开发一个SAX解析器

【注意】SAX主要用于对XML文档的解析，不能去修改、删除和添加元素。

1.1.SAX解析机制

在基于sax的程序中，有五个最常用的sax事件：

1.startDocument()–>告诉你解析器发现了文档的开始，告诉你解析器开始扫描文档
2.endDocument()–>告诉你解析器发现了文档结尾
3.startElement()–>告诉你解析器发现了一个起始标签，该事件告诉你标签的名称、该元素所有的属性名和值
4.characters()–>告诉你解析器发现了一些文本，将得到一个字符数组，该数组的偏移量和一个长度偏移量，有这三个变量你可以得到解析器发现的文本
5.endElement()–>告诉你解析器发现了一个结束标签，该事件告诉你元素的名称

1.2.SAX解析实例

依然使用DOM解析中用到的XML例子，如下：

<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>

【步骤】：

1.使用SAXParserFactory创建SAX解析工厂

SAXParserFactory spf = SAXParserFactory.newInstance();

2.通过SAX解析工厂得到解析器对象

SAXParser sp = spf.newSAXParser();

3.将解析对象和事件处理器对象关联

sp.parse("src/myClass.xml",new MyHandler());

class MyHandler extends DefaultHandler{    /**
     * 发现文档开始，该函数只会被调用一次
     */
    @Override
    public void startDocument() throws SAXException {
        System.out.println("startDocument");
    }    /**
     * 发现文档结束，该函数只会被调用一次
     */
    @Override
    public void endDocument() throws SAXException {
        System.out.println("endDocument");
    }    /**
     * 发现XML中的一个元素开始，会被反复调用
     */
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        System.out.println("元素名称："+qName);
    }    /**
     * 发现XML中的一个元素结束，会被反复调用
     */
    @Override
    public void endElement(String uri, String localName, String qName)            
    throws SAXException {

    }    /**
     * 发现XML文件中的文本，会被反复调用
     */
    @Override
    public void characters(char[] ch, int start, int length)            
    throws SAXException {        // 显示文本内容
        String text = new String(ch,start,length);        
        if(!text.trim().equals("")){
            System.out.println(text);
        }
    }
}

运行结果如下：

运行结果1

可以看到，这是对XML文档的一种遍历，而sax能够做的也只是遍历了。

那么，如果现在我们有这样一个需求：只显示所有学生的姓名和年龄，不显示学生的介绍，怎么实现呢？

1.定义两个布尔变量

private boolean isName = false;private boolean isAge = false;

2.在startElement方法中添加判断

@Overridepublic void startElement(String uri, String localName, String qName,
        Attributes attributes) throws SAXException {    if(qName.equals("名字")){        
        this.isName = true;
    }else if(qName.equals("年龄")){        this.isAge = true;
    }
}

3.在characters方法中根据标识符进行判断是否获取文本

@Overridepublic void characters(char[] ch, int start, int length)        throws SAXException {    // 显示文本内容
    String text = new String(ch,start,length);    if(!text.trim().equals("")&&(isName||isAge)){
        System.out.println(text);
    }
    isName = false;
    isAge = false;
}

最后要记得将两个布尔变量复位成false。
运行结果如下：

运行结果2

以上就是XML—XML解析之SAX的内容，更多相关内容请关注PHP中文网（www.php.cn）！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

RSS和XML：了解Web内容的动态二重奏Apr 19, 2025 am 12:03 AM

RSS和XML是用于网络内容管理的工具。RSS用于发布和订阅内容，XML用于存储和传输数据。它们的工作原理包括内容发布、订阅和更新推送。使用示例包括RSS发布博客文章和XML存储书籍信息。

RSS文档：Web联合组织的基础Apr 18, 2025 am 12:04 AM

RSS文档是基于XML的结构化文件，用于发布和订阅频繁更新的内容。它的主要作用包括：1)自动化内容更新，2)内容聚合，3)提高浏览效率。通过RSSfeed，用户可以订阅并及时获取来自不同来源的最新信息。

解码RSS：内容提要的XML结构Apr 17, 2025 am 12:09 AM

RSS的XML结构包括：1.XML声明和RSS版本，2.频道（Channel），3.条目（Item）。这些部分构成了RSS文件的基础，允许用户通过解析XML数据来获取和处理内容信息。

如何解析和利用基于XML的RSS提要Apr 16, 2025 am 12:05 AM

RSSFEEDSUSEXMLTOSYNDICATECONTENT; PARSINGTHEMINVOLVESLOADINGINGINGINGINSSTRUCTURE，andExtractingData.ApplicationsIncludeBuildBuildingNewSagGregatorSaterNewSagGregatorSator andTrackingPodcastepodcastepisodes。

RSS文档：他们如何提供您喜欢的内容Apr 15, 2025 am 12:01 AM

RSS文档的工作原理是通过XML文件发布内容更新，用户通过RSS阅读器订阅并接收通知。1.内容发布者创建并更新RSS文档。2.RSS阅读器定期访问并解析XML文件。3.用户浏览和阅读更新内容。使用示例：订阅TechCrunch的RSS源，只需复制链接到RSS阅读器中即可。

用XML建造供稿：RSS的动手指南Apr 14, 2025 am 12:17 AM

使用XML构建RSSfeed的步骤如下：1.创建根元素并设置版本；2.添加channel元素及其基本信息；3.添加条目（item）元素，包括标题、链接和描述；4.转换XML结构为字符串并输出。通过这些步骤，你可以从零开始创建一个有效的RSSfeed，并通过添加额外的元素如发布日期和作者信息来增强其功能。

创建RSS文档：逐步教程Apr 13, 2025 am 12:10 AM

创建RSS文档的步骤如下：1.使用XML格式编写，根元素为，包含元素。2.在内添加、、等元素描述频道信息。3.添加元素，每个代表一个内容条目，包含、、、等。4.可选地添加和元素，丰富内容。5.确保XML格式正确，使用在线工具验证，优化性能并保持内容更新。

XML在RSS中的作用：联合内容的基础Apr 12, 2025 am 12:17 AM

XML在RSS中的核心作用是提供一种标准化和灵活的数据格式。1.XML的结构和标记语言特性使其适合数据交换和存储。2.RSS利用XML创建标准化格式，方便内容共享。3.XML在RSS中的应用包括定义feed内容的元素，如标题和发布日期。4.优势包括标准化和可扩展性，挑战包括文件冗长和严格语法要求。5.最佳实践包括验证XML有效性、保持简洁、使用CDATA和定期更新。

See all articles