搜索
首页后端开发XML/RSS教程PHP扩展之XML操作(三)——XML解析器使用及相关函数



一、XML 元素结构例程

第一个例程缩进显示文档中的开始元素结构。


Example #1 显示 XML 元素结构


<?php$file = "data.xml";$depth = array();
function startElement($parser, $name, $attrs){
global $depth;
for ($i = 0; $i < $depth[$parser]; $i++) 
{
echo "  ";
}
echo "$name\n";
$depth[$parser]++;
}
function endElement($parser, $name){
global $depth;
$depth[$parser]--;
}
$xml_parser = xml_parser_create();
xml_set_element_handler($xml_parser, "startElement", "endElement");
if (!($fp = fopen($file, "r"))) 
{die("could not open XML input");
}
while ($data = fread($fp, 4096)) 
{
if (!xml_parse($xml_parser, $data, feof($fp))) {
die(sprintf("XML error: %s at line %d",xml_error_string(xml_get_error_code($xml_parser)),
xml_get_current_line_number($xml_parser)));
}
}xml_parser_free($xml_parser);
?>


二、XML 标签映射例程

Example #1 将 XML 映射为 HTML


此例程直接地将 XML 标签映射为 HTML 标签。 在“map_array”中未找到的元素将被忽略。 当然,此例程只针对特定的 XML 文档类型起作用。


<?php$file = "data.xml";
$map_array = array("BOLD"     => "B","EMPHASIS" => "I","LITERAL"  => "TT");
function startElement($parser, $name, $attrs){
global $map_array;
if (isset($map_array[$name])) {
echo "<$map_array[$name]>";
}
}
function endElement($parser, $name){global $map_array;
if (isset($map_array[$name])) {
echo "</$map_array[$name]>";}
}
function characterData($parser, $data){
echo $data;
}
$xml_parser = xml_parser_create();
// use case-folding so we are sure to find the tag in 
$map_arrayxml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, true);
xml_set_element_handler($xml_parser, "startElement", "endElement");
xml_set_character_data_handler($xml_parser, "characterData");
if (!($fp = fopen($file, "r"))) 
{die("could not open XML input");
}
while ($data = fread($fp, 4096)) {
if (!xml_parse($xml_parser, $data, feof($fp))) {
die(sprintf("XML error: %s at line %d",
xml_error_string(xml_get_error_code($xml_parser)),
xml_get_current_line_number($xml_parser)));}
}
xml_parser_free($xml_parser);
?>


三、XML 外部实体例程

此例程用于加亮 XML 代码。举例说明如何使用外部实体引用来包含和解析其他文档, 及处理指令是如何被处理的,及判断处理指令所包含代码是否“可信任”的一种方法

用于此例程的 XML 文档位于此例程的下方( 和 )。


Example #1 外部实体例程


<?php$file = "xmltest.xml";
function trustedFile($file){
// 仅信任本地文件
if (!preg_match("@^([a-z]+)\:\/\/@i", $file)&& fileowner($file) == getmyuid()) {return true;}return false;}
function startElement($parser, $name, $attribs){
echo "&lt;<font color=\"#0000cc\">$name</font>";
if (count($attribs)) {
foreach ($attribs as $k => $v) {
echo " <font color=\"#009900\">$k</font>=\"<fontcolor=\"#990000\">$v</font>\"";}}
echo "&gt;";
}
function endElement($parser, $name){
echo "&lt;/<font color=\"#0000cc\">$name</font>&gt;";
}
function characterData($parser, $data){
echo "<b>$data</b>";
}
function PIHandler($parser, $target, $data){
switch (strtolower($target)) {case "php":global $parser_file;
// 如何要解析的文档是“可信任”的, 则说明可安全// 地执行其内部的 PHP 代码。否则,显示代码内容。
if (trustedFile($parser_file[$parser])) {
eval($data);
} 
else {printf("Untrusted PHP code: <i>%s</i>",htmlspecialchars($data));
}
break;}}
function defaultHandler($parser, $data){
if (substr($data, 0, 1) == "&" && substr($data, -1, 1) == ";") {
printf(&#39;<font color="#aa00aa">%s</font>&#39;,htmlspecialchars($data));
} 
else {printf(&#39;<font size="-1">%s</font>&#39;,htmlspecialchars($data));}}
function externalEntityRefHandler($parser, $openEntityNames, $base, $systemId,$publicId) {
if ($systemId) {if (!list($parser, $fp) = new_xml_parser($systemId)) {printf("Could not open entity %s at %s\n", $openEntityNames,$systemId);
return false;}while ($data = fread($fp, 4096)) {if (!xml_parse($parser, $data, feof($fp))) {
printf("XML error: %s at line %d while parsing entity %s\n",xml_error_string(xml_get_error_code($parser)),xml_get_current_line_number($parser), 
$openEntityNames);xml_parser_free($parser);return false;}}xml_parser_free($parser);return true;}return false;}
function new_xml_parser($file){global $parser_file;
$xml_parser = xml_parser_create();xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, 1);
xml_set_element_handler($xml_parser, "startElement", "endElement");
xml_set_character_data_handler($xml_parser, "characterData");
xml_set_processing_instruction_handler($xml_parser, "PIHandler");
xml_set_default_handler($xml_parser, "defaultHandler");
xml_set_external_entity_ref_handler($xml_parser, "externalEntityRefHandler");
if (!($fp = @fopen($file, "r"))) {return false;}
if (!is_array($parser_file)) {settype($parser_file, "array");}$parser_file[$xml_parser] = $file;
return array($xml_parser, $fp);}
if (!(list($xml_parser, $fp) = new_xml_parser($file))) {die("could not open XML input");}
echo "<pre class="brush:php;toolbar:false">";
while ($data = fread($fp, 4096)) {
if (!xml_parse($xml_parser, $data, feof($fp))) {
die(sprintf("XML error: %s at line %d\n",
xml_error_string(xml_get_error_code($xml_parser)),
xml_get_current_line_number($xml_parser)));}}
echo "
";echo "parse complete\n"; xml_parser_free($xml_parser); ?>

Example #2 xmltest.xml

025f411b6c80e9e39bd6b0129692fa04
0ee24980a98834caea670d4ad1f2d197
6930c6f1e77bb11139eaffe81fcc7033
]>
8bfd02febb9b8b1ce76fb02e4f8fa74b
 08eb756f81b28a01d33212cce3fbe742Title &plainEntity;0e94189e2178ffcfb346fb78b3f60691
 5cdffc578c0c157aa49f9146402bc6dc
  eda1dae27a8d1fa57009d4d55aa88c3f
   c870fa3fa6f761c72e2376ed78df1372
    92cee25da80fac49f6fb6eec5fd2c22a
     2bef0154f7bc75ad48fa20d0234d078f581fde655cd4aa74a0e857b718d4c325a1c24f0f755fd404b426dca15a40629266542a628702c8e90b3ea600e9e3d5dd81b1c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325c1c24f0f755fd404b426dca15a40629266bfc5ba3ced2d28da81ddbf956f66515e
     2bef0154f7bc75ad48fa20d0234d078f581fde655cd4aa74a0e857b718d4c325a2c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325c2c24f0f755fd404b426dca15a40629266bfc5ba3ced2d28da81ddbf956f66515e
     2bef0154f7bc75ad48fa20d0234d078f581fde655cd4aa74a0e857b718d4c325a3c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325b3c24f0f755fd404b426dca15a40629266581fde655cd4aa74a0e857b718d4c325c3c24f0f755fd404b426dca15a40629266bfc5ba3ced2d28da81ddbf956f66515e
    ca745a59da05f784b8811374296574e1
   adaedcdd287fe57618015106aeda16ea
  6b0c63bbacd8835a656b6d5d011eafbd
 8100103272b7d0e046d0adad5498ea61
 &systemEntity;
 498c4af2fa291b23083978cd5673e9b2
  b2386ffb911b14667cb8f0f91ea547a7About this Document6e916e0f7d1e588d4f442bf645aedb2f
  5cdffc578c0c157aa49f9146402bc6dc
   b440be2def2e0373bb3a224a0c239bee
   5cab44c4c877f96530793145241d78a0
  8100103272b7d0e046d0adad5498ea61
 4d7ab0de9a42de71c682b0860bad1410
9e466180161ad6094e410bc58577745d

此文件包含在  中:


Example #3 xmltest2.xml


a2b87cb9bd1ae56f29bc02649eafc0b3
05b38f46ee6fba3f9299325c8c0797bf
]>
4f6c438d899b152724c4699117ad9ccf
   042801de61348b00352ccc027d182aa6
   &testEnt;
   8d88354edae7ed9f6a5581d7870d6839
f82583eb14e508b4f2b959dd93fdb04e

四、XML解析器函数

  • utf8_decode — 将用 UTF-8 方式编码的 ISO-8859-1 字符串转换成单字节的 ISO-8859-1 字符串。

  • utf8_encode — 将 ISO-8859-1 编码的字符串转换为 UTF-8 编码

  • xml_error_string — 获取 XML 解析器的错误字符串

  • xml_get_current_byte_index — 获取 XML 解析器的当前字节索引

  • xml_get_current_column_number — 获取 XML 解析器的当前列号

  • xml_get_current_line_number — 获取 XML 解析器的当前行号

  • xml_get_error_code — 获取 XML 解析器错误代码

  • xml_parse_into_struct — 将 XML 数据解析到数组中

  • xml_parse — 开始解析一个 XML 文档

  • xml_parser_create_ns — 生成一个支持命名空间的 XML 解析器

  • xml_parser_create — 建立一个 XML 解析器

  • xml_parser_free — 释放指定的 XML 解析器

  • xml_parser_get_option — 从 XML 解析器获取选项设置信息

  • xml_parser_set_option — 为指定 XML 解析进行选项设置

  • xml_set_character_data_handler — 建立字符数据处理器

  • xml_set_default_handler — 建立默认处理器

  • xml_set_element_handler — 建立起始和终止元素处理器

  • xml_set_end_namespace_decl_handler — 建立终止命名空间声明处理器

  • xml_set_external_entity_ref_handler — 建立外部实体指向处理器

  • xml_set_notation_decl_handler — 建立注释声明处理器

  • xml_set_object — 在对象中使用 XML 解析器

  • xml_set_processing_instruction_handler — 建立处理指令(PI)处理器

  • xml_set_start_namespace_decl_handler — 建立起始命名空间声明处理器

  • xml_set_unparsed_entity_decl_handler — 建立未解析实体定义声明处理器

以上就是以上就是的内容,更多相关内容请关注PHP中文网(www.php.cn)!的内容,更多相关内容请关注PHP中文网(www.php.cn)!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
RSS提要:探索XML的作用和目的RSS提要:探索XML的作用和目的Apr 28, 2025 am 12:06 AM

XML在RSSFeed中的作用是结构化数据、标准化和提供可扩展性。1.XML使得RSSFeed的数据结构化,便于解析和处理。2.XML提供了一种标准化的方式来定义RSSFeed的格式。3.XML的可扩展性使得RSSFeed可以根据需要添加新的标签和属性。

缩放XML/RSS处理:性能优化技术缩放XML/RSS处理:性能优化技术Apr 27, 2025 am 12:28 AM

处理XML和RSS数据时,可以通过以下步骤优化性能:1)使用高效的解析器如lxml提升解析速度;2)采用SAX解析器减少内存使用;3)利用XPath表达式提高数据提取效率;4)实施多进程并行处理提升处理速度。

RSS文档格式:探索RSS 2.0及以后RSS文档格式:探索RSS 2.0及以后Apr 26, 2025 am 12:22 AM

RSS2.0是一种开放标准,允许内容发布者以结构化的方式分发内容。它包含了丰富的元数据,如标题、链接、描述、发布日期等,使得订阅者能够快速浏览和访问内容。RSS2.0的优势在于其简洁和扩展性。例如,它允许自定义元素,这意味着开发者可以根据需求添加额外的信息,如作者、分类等。

理解RSS:XML观点理解RSS:XML观点Apr 25, 2025 am 12:14 AM

RSS是一种基于XML的格式,用于发布经常更新的内容。1.RSSfeed通过XML结构化组织信息,包括标题、链接、描述等。2.创建RSSfeed需按照XML结构编写,添加元数据如语言和发布日期。3.高级用法可包含多媒体文件和分类信息。4.调试时使用XML验证工具,确保必需元素存在且编码正确。5.优化RSSfeed可通过分页、缓存和保持结构简洁来实现。通过理解和应用这些知识,可以有效管理和分发内容。

XML中的RSS:解码标签,属性和结构XML中的RSS:解码标签,属性和结构Apr 24, 2025 am 12:09 AM

RSS是一种基于XML的格式,用于发布和订阅内容。RSS文件的XML结构包括根元素、元素和多个元素,每个代表一个内容条目。通过XML解析器读取和解析RSS文件,用户可以订阅并获取最新内容。

XML在RSS中的优势:技术深度潜水XML在RSS中的优势:技术深度潜水Apr 23, 2025 am 12:02 AM

XML在RSS中具有结构化数据、可扩展性、跨平台兼容性和解析验证的优势。1)结构化数据确保内容的一致性和可靠性;2)可扩展性允许添加自定义标签以适应内容需求;3)跨平台兼容性使其在不同设备上无缝工作;4)解析和验证工具确保Feed的质量和完整性。

XML中的RSS:揭示内容联合的核心XML中的RSS:揭示内容联合的核心Apr 22, 2025 am 12:08 AM

RSS在XML中的实现方式是通过结构化的XML格式来组织内容。1)RSS使用XML作为数据交换格式,包含频道信息和项目列表等元素。2)生成RSS文件需按规范组织内容,发布到服务器供订阅。3)RSS文件可通过阅读器或插件订阅,实现内容自动更新。

超越基础:高级RSS文档功能超越基础:高级RSS文档功能Apr 21, 2025 am 12:03 AM

RSS的高级功能包括内容命名空间、扩展模块和条件订阅。1)内容命名空间扩展RSS功能,2)扩展模块如DublinCore或iTunes添加元数据,3)条件订阅根据特定条件筛选条目。这些功能通过添加XML元素和属性实现,提升信息获取效率。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器