XML解析中的namespace初步了解-XML/RSS教程-PHP中文网

首页

后端开发

XML/RSS教程

XML解析中的namespace初步了解

黄舟

Mar 17, 2017 pm 05:32 PM

初学者在解析XML文件的时候最容易遇到的问题恐怕就是XML的namespace了，本文旨在对namespace做一个简要的介绍。

namespace的意义无需多说，和C++，C#等高级语言一样，XML同样面临大量文件放在一起的时候变量重名的问题，所以要用namespace把名字相同意义不同的变量隔离开。本文着重讨论namespace的解析方法。

以下是一个简单的XML文件:

<root>
   <child id = ‘0’> 
      hello world 
   </child>
   <child id=&#39;1&#39;>
     one
   </child>
</root>

这个例子里面没有namespace，大家初学XML时接触的例子恐怕都是这样的。这种例子具有误导性，初学者解析出了hello world之后就兴高采烈的拿同样的程序去解析实际的XML文件，往往铩羽而归。下面是一段豆瓣API返回的XML文件

<?xml version="1.0" encoding="UTF-8"?>
<entry xmlns="http://www.w3.org/2005/Atom" xmlns:db="http://www.douban.com/xmlns/" 
xmlns:gd="http://schemas.google.com/g/2005" xmlns:opensearch="http://a9.com/-/spec/opensearchrss/1.0/">  
<id>http://api.douban.com/event/10069638</id>  
<title>Debugging the Web </title>  
<category scheme="http://www.douban.com/2007#kind" term="http://www.douban.com/2007#event.salon"/>  
<author>    
<link href="http://api.douban.com/people/1057620" rel="self"/>    
<link href="http://www.douban.com/people/aka/" rel="alternate"/>    
<link href="http://t.douban.com/icon/u1057620-16.jpg" rel="icon"/>
    name>胖胖的大头鱼</name>    
    <uri>http://api.douban.com/people/1057620</uri>
    </author>
<db:attribute name="invite_only">no</db:attribute>

看到这么多www就不想看直接跳过，然后看到熟悉的48fe722b397613e801e59f453d6c9330 069b8d673ec8f2ad312c1b3588acdb70, 果断套用上面例子的程序，一运行却啥都得不到，问题到底出在哪？C#提供一大堆的XML类，XDocument, XReader, XPath, XmlDocument，是不是我现在用的这种类不给力啊，没法确定只好乱试，一乱试一晚上就过去了。童鞋，我们还是静下心来逐行看看吧。

44268761adfa814cf615c226dea79439这行没看头，看下面这里275a8eb10cd2245514d806bd70263c8dnoea6f540cddccdca7d953c18eb1eb3288这句话，可以理解了，db是一个namespace的简称，方便写在元素的名字前面，这样5a37d16f53356ad61c30ba4c13522081 和 e8aa4f7ce323535a9b01247c46fe6139, 02d8a117819869c76bcd3e50c8e21798就不一样了。这种简称可以在一个文档里面区别变量，但是对大量的文档还是不行，所以namespace还有一个全称，就是这里的http://www.douban.com/xmlns/。这个全称其实写什么内容都行，对XML Parser来说都是当做字符串来处理的，但一来想名字比较麻烦，二来可以顺道做个广告，所以大家一般都用的网址。Parse的时候Parser根据全称来区别变量，所以就算两个文档中都有5a37d16f53356ad61c30ba4c13522081，只要全称不一样，都没有问题。

这么说就比较清楚了，但那个http://www.w3.org/2005/Atom到底是个啥啊，连个简称都没有。哎，意识到这个就对了，他的简称就是””,空串。这东西被称为default namespace，那些看上去没有前缀的都是在这个namespace下的。所以那个48fe722b397613e801e59f453d6c9330不是裸的啊，人家其实是 ff0263bc51bb8a21b38871afee372a50 所以裸的程序当然是解析不了的了。

那么该如何解析呢？这里提供一个样例程序，希望对大家有帮助。这个代码可以在WP7上运行。我还有一个版本用的XmlDocument，尼玛WP7上木有这个类，坑爹的。。。

  string file = @"C:\Users\v-menlin\Documents\Visual Studio 2010\Projects\test\test\test.xml";
            XDocument doc = XDocument.Load( file );
            //use following code to parse a string 
            //XDocument doc = XDocument.Parse( string );

            //对于XML文件中所有的没加类似db:这种的元素，用下列方法
            XNamespace d = @"http://www.w3.org/2005/Atom";
            foreach ( XElement element in doc.Descendants( d + "title" ) )
            {
                Console.WriteLine( element.Value );
            }
            //<author>下面包含了<link>,一下的例子还示例了如何读取属性。
            foreach ( XElement element in doc.Descendants( d + "author" ) )
            {
                foreach ( XElement inelement in element.Descendants( d + "link" ) )
                {
                    Console.WriteLine( inelement.Attribute( "href" ).Value );
                    Console.WriteLine( inelement.Attribute( "rel" ).Value );
                }
            }

            Console.WriteLine();
            //对于加了冒号前缀的元素，使用下列代码
            XNamespace db = @"http://www.douban.com/xmlns/";
            foreach ( XElement element in doc.Descendants( db + "attribute" ) )
            {
                Console.WriteLine( element.Attribute( "name" ).Value );
                Console.WriteLine( element.Value );
            }
            //其实只是NameSpace的头部换了一下。

            //下面列出其他几个常用头部，直接换用。
            XNamespace gd = @"http://schemas.google.com/g/2005";
            XNamespace opensearch = @"http://a9.com/-/spec/opensearchrss/1.0/";

以上是XML解析中的namespace初步了解的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

创建RSS文档：逐步教程Apr 13, 2025 am 12:10 AM

创建RSS文档的步骤如下：1.使用XML格式编写，根元素为，包含元素。2.在内添加、、等元素描述频道信息。3.添加元素，每个代表一个内容条目，包含、、、等。4.可选地添加和元素，丰富内容。5.确保XML格式正确，使用在线工具验证，优化性能并保持内容更新。

XML在RSS中的作用：联合内容的基础Apr 12, 2025 am 12:17 AM

XML在RSS中的核心作用是提供一种标准化和灵活的数据格式。1.XML的结构和标记语言特性使其适合数据交换和存储。2.RSS利用XML创建标准化格式，方便内容共享。3.XML在RSS中的应用包括定义feed内容的元素，如标题和发布日期。4.优势包括标准化和可扩展性，挑战包括文件冗长和严格语法要求。5.最佳实践包括验证XML有效性、保持简洁、使用CDATA和定期更新。

从XML到可读的内容：揭开RSS feed的神秘面纱Apr 11, 2025 am 12:03 AM

rssfeedsarexmldocuments usedforcontentAggregation and distribution.totransformthemintoreadableContent：1）parsethethexmlusinglibrarieslibrariesliblarieslikeparserinparserinpython.2）andledifferentifferentrssssssssssssssssssssssssssssssssssssssssssssssersions andpotentionparsingrorS.3）

是否有基于JSON的RSS替代方案？Apr 10, 2025 am 09:31 AM

JSONFeed是一种基于JSON的RSS替代方案，其优势在于简洁性和易用性。1)JSONFeed使用JSON格式，易于生成和解析。2)它支持动态生成，适用于现代Web开发。3)使用JSONFeed可以提升内容管理效率和用户体验。

RSS文档工具：构建，验证和发布提要Apr 09, 2025 am 12:10 AM

如何构建、验证和发布RSSfeeds？1.构建：使用Python脚本生成RSSfeed，包含标题、链接、描述和发布日期。2.验证：使用FeedValidator.org或Python脚本检查RSSfeed是否符合RSS2.0标准。3.发布：将RSS文件上传到服务器，或使用Flask动态生成并发布RSSfeed。通过这些步骤，你可以有效管理和分享内容。

确保您的XML/RSS提要：全面的安全清单Apr 08, 2025 am 12:06 AM

确保XML/RSSfeeds安全性的方法包括：1.数据验证，2.加密传输，3.访问控制，4.日志和监控。这些措施通过网络安全协议、数据加密算法和访问控制机制来保护数据的完整性和机密性。

XML/RSS面试问题和答案：提高您的专业知识Apr 07, 2025 am 12:19 AM

XML是一种标记语言，用于存储和传输数据，RSS是一种基于XML的格式，用于发布频繁更新的内容。1）XML通过标签和属性描述数据结构，2）RSS定义特定标签发布和订阅内容，3）使用Python的xml.etree.ElementTree模块可以创建和解析XML，4）XPath表达式可查询XML节点，5）feedparser库可解析RSSfeed，6）常见错误包括标签不匹配和编码问题，可用xmllint验证，7）使用SAX解析器处理大型XML文件可优化性能。