search
Homephp教程php手册用PHP读取和编写XML DOM的实现代码

有许多技术可用于用 PHP 读取和编写 XML。本文提供了三种方法读取 XML:使用 DOM 库、使用 SAX 解析器和使用正则表达式。还介绍了使用 DOM 和 PHP 文本模板编写

用 PHP 读取和编写可扩展标记语言(XML)看起来可能有点恐怖。实际上,XML 和它的所有相关技术可能是恐怖的,但是用 PHP 读取和编写 XML 不一定是项恐怖的任务。首先,需要学习一点关于 XML 的知识 —— 它是什么,用它做什么。然后,需要学习如何用 PHP 读取和编写 XML,而有许多种方式可以做这件事。
本文提供了 XML 的简短入门,然后解释如何用 PHP 读取和编写 XML。
什么是 XML?
XML 是一种数据存储格式。它没有定义保存什么数据,也没有定义数据的格式。XML 只是定义了标记和这些标记的属性。格式良好的 XML 标记看起来像这样:
Jack Herrington
这个 标记包含一些文本:Jack Herrington。
不包含文本的 XML 标记看起来像这样:

用 XML 对某件事进行编写的方式不止一种。例如,这个标记形成的输出与前一个标记相同:

也可以向 XML 标记添加属性。例如,这个 标记包含 first 和 last 属性:

也可以用 XML 对特殊字符进行编码。例如,& 符号可以像这样编码:
&
包含标记和属性的 XML 文件如果像示例一样格式化,就是格式良好的,这意味着标记是对称的,字符的编码正确。清单 1 是一份格式良好的 XML 的示例。

清单 1. XML 图书列表示例

复制代码 代码如下:




Jack Herrington
PHP Hacks
O'Reilly


Jack Herrington
Podcasting Hacks
O'Reilly



清单 1 中的 XML 包含一个图书列表。父标记 包含一组 标记,每个 标记又包含 和 <publisher> 标记。 <br>当 XML 文档的标记结构和内容得到外部模式文件的验证后,XML 文档就是正确的。模式文件可以用不同的格式指定。对于本文来说,所需要的只是格式良好的 XML。 <br>如果觉得 XML 看起来很像超文本标记语言(HTML),那么就对了。XML 和 HTML 都是基于标记的语言,它们有许多相似之处。但是,要着重指出的是:虽然 XML 文档可能是格式良好的 HTML,但不是所有的 HTML 文档都是格式良好的 XML。换行标记(br)是 XML 和 HTML 之间区别的一个好例子。这个换行标记是格式良好的 HTML,但不是格式良好的 XML: <br><p>This is a paragraph<br> <br>With a line break</p> <br>这个换行标记是格式良好的 XML 和 HTML: <br><p>This is a paragraph<br> <br>With a line break</p> <br>如果要把 HTML 编写成同样是格式良好的 XML,请遵循 W3C 委员会的可扩展超文本标记语言(XHTML)标准。所有现代的浏览器都能呈现 XHTML。而且,还可以用 XML 工具读取 XHTML 并找出文档中的数据,这比解析 HTML 容易得多。 <br>使用 DOM 库读取 XML <br>读取格式良好的 XML 文件最容易的方式是使用编译成某些 PHP 安装的文档对象模型 (DOM)库。DOM 库把整个 XML 文档读入内存,并用节点树表示它,如图 1 所示。 <br>图 1. 图书 XML 的 XML DOM 树 <br><p align="center"><img src="/static/imghwm/default1.png" data-src="http://www.68idc.cn/help/uploads/allimg/121109/152934cF_0.gif" class="lazy" alt="用PHP读取和编写XML DOM的实现代码" ></p><br>树顶部的 books 节点有两个 book 子标记。在每本书中,有 author、publisher 和 title 几个节点。author、publisher 和 title 节点分别有包含文本的文本子节点。 <br>读取图书 XML 文件并用 DOM 显示内容的代码如清单 2 所示。 <br>清单 2. 用 DOM 读取图书 XML <br><p><span>复制代码</span> 代码如下:</p><p> <br><?php <BR>$doc = new DOMDocument(); <br>$doc->load( 'books.xml' ); <br>$books = $doc->getElementsByTagName( "book" ); <br>foreach( $books as $book ) <br>{ <br>$authors = $book->getElementsByTagName( "author" ); <br>$author = $authors->item(0)->nodeValue; <br>$publishers = $book->getElementsByTagName( "publisher" ); <br>$publisher = $publishers->item(0)->nodeValue; <br>$titles = $book->getElementsByTagName( "title" ); <br>$title = $titles->item(0)->nodeValue; <br>echo "$title - $author - $publisher\n"; <br>} <br>?> <br></p> <br>脚本首先创建一个 new DOMdocument 对象,用 load 方法把图书 XML 装入这个对象。之后,脚本用 getElementsByName 方法得到指定名称下的所有元素的列表。 <br>在 book 节点的循环中,脚本用 getElementsByName 方法获得 author、publisher 和 title 标记的 nodeValue。nodeValue 是节点中的文本。脚本然后显示这些值。 <br>可以在命令行上像这样运行 PHP 脚本: <br>% php e1.php <br>PHP Hacks - Jack Herrington - O'Reilly <br>Podcasting Hacks - Jack Herrington - O'Reilly <br>% <br>可以看到,每个图书块输出一行。这是一个良好的开始。但是,如果不能访问 XML DOM 库该怎么办? <br>用 SAX 解析器读取 XML <br>读取 XML 的另一种方法是使用 XML Simple API(SAX)解析器。PHP 的大多数安装都包含 SAX 解析器。SAX 解析器运行在回调模型上。每次打开或关闭一个标记时,或者每次解析器看到文本时,就用节点或文本的信息回调用户定义的函数。 <br>SAX 解析器的优点是,它是真正轻量级的。解析器不会在内存中长期保持内容,所以可以用于非常巨大的文件。缺点是编写 SAX 解析器回调是件非常麻烦的事。清单 3 显示了使用 SAX 读取图书 XML 文件并显示内容的代码。 <br>清单 3. 用 SAX 解析器读取图书 XML <br><p><span>复制代码</span> 代码如下:</p><p> <br><?php <BR>$g_books = array(); <br>$g_elem = null; <br>function startElement( $parser, $name, $attrs ) <br>{ <br>global $g_books, $g_elem; <br>if ( $name == 'BOOK' ) $g_books []= array(); <br>$g_elem = $name; <br>} <br>function endElement( $parser, $name ) <br>{ <br>global $g_elem; <br>$g_elem = null; <br>} <br>function textData( $parser, $text ) <br>{ <br>global $g_books, $g_elem; <br>if ( $g_elem == 'AUTHOR' || <br>$g_elem == 'PUBLISHER' || <br>$g_elem == 'TITLE' ) <br>{ <br>$g_books[ count( $g_books ) - 1 ][ $g_elem ] = $text; <br>} <br>} <br>$parser = xml_parser_create(); <br>xml_set_element_handler( $parser, "startElement", "endElement" ); <br>xml_set_character_data_handler( $parser, "textData" ); <br>$f = fopen( 'books.xml', 'r' ); <br>while( $data = fread( $f, 4096 ) ) <br>{ <br>xml_parse( $parser, $data ); <br>} <br>xml_parser_free( $parser ); <br>foreach( $g_books as $book ) <br>{ <br>echo $book['TITLE']." - ".$book['AUTHOR']." - "; <br>echo $book['PUBLISHER']."\n"; <br>} <br>?> <br></p> <br>脚本首先设置 g_books 数组,它在内存中容纳所有图书和图书信息,g_elem 变量保存脚本目前正在处理的标记的名称。然后脚本定义回调函数。在这个示例中,回调函数是 startElement、endElement 和 textData。在打开和关闭标记的时候,分别调用 startElement 和 endElement 函数。在开始和结束标记之间的文本上面,调用 textData。 <br>在这个示例中,startElement 标记查找 book 标记,在 book 数组中开始一个新元素。然后,textData 函数查看当前元素,看它是不是 publisher、title 或 author 标记。如果是,函数就把当前文本放入当前图书。 <br>为了让解析继续,脚本用 xml_parser_create 函数创建解析器。然后,设置回调句柄。之后,脚本读取文件并把文件的大块内容发送到解析器。在文件读取之后,xml_parser_free 函数删除解析器。脚本的末尾输出 g_books 数组的内容。 <br>可以看到,这比编写 DOM 的同样功能要困难得多。如果没有 DOM 库也没有 SAX 库该怎么办?还有替代方案么? <br>-------------------------------------------------------------------------------- <br>回页首 <br>用正则表达式解析 XML <br>可以肯定,即使提到这个方法,有些工程师也会批评我,但是确实可以用正则表达式解析 XML。清单 4 显示了使用 preg_ 函数读取图书文件的示例。 <br>清单 4. 用正则表达式读取 XML <br><p><span>复制代码</span> 代码如下:</p> </publisher>
Statement
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
如何使用pandas正确读取txt文件如何使用pandas正确读取txt文件Jan 19, 2024 am 08:39 AM

如何使用pandas正确读取txt文件,需要具体代码示例Pandas是一个广泛使用的Python数据分析库,它可以用于处理各种各样的数据类型,包括CSV文件、Excel文件、SQL数据库等。同时,它也可以用于读取文本文件,例如txt文件。但是,在读取txt文件时,我们有时会遇到一些问题,例如编码问题、分隔符问题等。本文将介绍如何使用pandas正确读取txt

使用pandas读取txt文件的实用技巧使用pandas读取txt文件的实用技巧Jan 19, 2024 am 09:49 AM

使用pandas读取txt文件的实用技巧,需要具体代码示例在数据分析和数据处理中,txt文件是一种常见的数据格式。使用pandas读取txt文件可以快速、方便地进行数据处理。本文将介绍几种实用的技巧,以帮助你更好的使用pandas读取txt文件,并配以具体的代码示例。读取带有分隔符的txt文件使用pandas读取带有分隔符的txt文件时,可以使用read_c

Java 中使用 OpenCSV 读取和写入 CSV 文件的示例Java 中使用 OpenCSV 读取和写入 CSV 文件的示例Dec 20, 2023 pm 01:39 PM

Java中使用OpenCSV读取和写入CSV文件的示例CSV(Comma-SeparatedValues)指的是以逗号分隔的数值,是一种常见的数据存储格式。在Java中,OpenCSV是一个常用的工具库,用于读取和写入CSV文件。本文将介绍如何使用OpenCSV来实现读取和写入CSV文件的示例。引入OpenCSV库首先,需要引入OpenCSV库到

Pandas读取网页数据的实用方法Pandas读取网页数据的实用方法Jan 04, 2024 am 11:35 AM

Pandas读取网页数据的实用方法,需要具体代码示例在数据分析和处理过程中,我们经常需要从网页中获取数据。而Pandas作为一种强大的数据处理工具,提供了方便的方法来读取和处理网页数据。本文将介绍几种常用的Pandas读取网页数据的实用方法,并附上具体的代码示例。方法一:使用read_html()函数Pandas的read_html()函数可以直接从网页中读

Pandas使用教程:读取JSON文件的快速入门Pandas使用教程:读取JSON文件的快速入门Jan 13, 2024 am 10:15 AM

快速入门:Pandas读取JSON文件的方法,需要具体代码示例引言:在数据分析和数据科学领域,Pandas是一个重要的Python库之一。它提供了丰富的功能和灵活的数据结构,能够方便地对各种数据进行处理和分析。在实际应用中,我们经常会遇到需要读取JSON文件的情况。本文将介绍如何使用Pandas来读取JSON文件,并附上具体的代码示例。一、Pandas的安装

PHP读取Excel文件方法及常见问题解答PHP读取Excel文件方法及常见问题解答Jun 09, 2023 am 11:41 AM

PHP读取Excel文件方法及常见问题解答Excel是一种非常普遍的电子表格文件格式,很多业务和数据都存放在Excel文件中。在开发过程中,如果需要将Excel文件中的数据导入系统中,就需要使用PHP读取Excel文件。本文将介绍PHP读取Excel文件的方法及常见问题解答。一、PHP读取Excel文件方法1.使用PHPExcel类库PHPExcel是一个P

PHP文件处理入门:读取与写入的步骤指引PHP文件处理入门:读取与写入的步骤指引Sep 06, 2023 am 09:58 AM

PHP文件处理入门:读取与写入的步骤指引在Web开发中,文件处理是一项常见的任务,无论是读取用户上传的文件,还是将结果写入文件供后续使用,理解如何在PHP中进行文件处理都是至关重要的。本文将提供一个简单的指引,介绍PHP中文件的读取和写入的基本步骤,并附上代码示例供参考。文件读取在PHP中,可以使用fopen()函数打开一个文件,返回一个文件资源(file

Golang如何读取二进制文件?Golang如何读取二进制文件?Mar 21, 2024 am 08:27 AM

Golang如何读取二进制文件?二进制文件是以二进制形式存储的文件,其中包含了计算机能够识别和处理的数据。在Golang中,我们可以使用一些方法来读取二进制文件,并将其解析成我们想要的数据格式。下面将介绍如何在Golang中读取二进制文件,并给出具体的代码示例。首先,我们需要使用os包中的Open函数打开一个二进制文件,这将返回一个文件对象。然后,我们可以使

See all articles

Hot AI Tools

Undresser.AI Undress

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress AI Tool

Undress images for free

Clothoff.io

Clothoff.io

AI clothes remover

AI Hentai Generator

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

Hot Tools

WebStorm Mac version

WebStorm Mac version

Useful JavaScript development tools

DVWA

DVWA

Damn Vulnerable Web App (DVWA) is a PHP/MySQL web application that is very vulnerable. Its main goals are to be an aid for security professionals to test their skills and tools in a legal environment, to help web developers better understand the process of securing web applications, and to help teachers/students teach/learn in a classroom environment Web application security. The goal of DVWA is to practice some of the most common web vulnerabilities through a simple and straightforward interface, with varying degrees of difficulty. Please note that this software

Zend Studio 13.0.1

Zend Studio 13.0.1

Powerful PHP integrated development environment

Dreamweaver Mac version

Dreamweaver Mac version

Visual web development tools

Notepad++7.3.1

Notepad++7.3.1

Easy-to-use and free code editor