PHP XML Expat 解析器
內建的 Expat 解析器使在 PHP 中處理 XML 文件成為可能。
XML 是什麼?
XML即可擴充標記語言(eXtensible Markup Language)。標記是指電腦所能理解的資訊符號,透過此種標記,電腦之間可以處理包含各種資訊的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,例如HTML,也可以使用象XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。 XML是從SGML簡化修改出來的。它主要用到的有XML、XSL和XPath等。
上面這段是XML的一個基本定義,一個被廣泛接受的說明。簡單說,XML就是一種資料的描述語言,雖然它是語言,但通常情況下,它並不具備常見語言的基本功能──被電腦辨識並運作。只有依靠另一種語言,來解釋它,使它達到你想要的效果或被電腦所接受。
假如你是剛接觸XML的新手,那麼可能無法從定義上是了解XML是什麼。也許,你可以換個角度來認識XML是什麼;從應用面來認識XML,從XML可以做些什麼來認識它,這應該能比那更空洞的定義對你更有幫助。
XML應用程式主要分為兩種類型,文件型和資料型。以下介紹幾個常見的XML應用程式:
1、自訂XML+XSLT=>HTML,最常見的文件型應用程式之一。 XML存放整個文件的XML數據,然後XSLT將XML轉換、解析,結合XSLT中的HTML標籤,最終成為HTML,顯示在瀏覽器上。典型的例子就是CSDN上的貼文。
2、XML作為微型資料庫,這是最常見的資料型應用之一。我們利用相關的XML API(MSXML DOM、JAVA DOM等)對XML進行存取和查詢。留言板的實作中,就常常可以看到用XML作為資料庫。
3、作為通訊資料。最典型的就是WEB SERVICE,利用XML來傳遞資料。
4、作為一些應用程式的設定資訊資料。常見的如J2EE配置WEB伺服器時所用的web.XML。
5、其他一些文件的XML格式。如WORD、EXCEL等。
6、儲存資料間的映射關係。如Hibernate。
這裡介紹的6種應用,基本上涵蓋了XML的主要用途。總之,XML是一種抽象的語言,它不如傳統的程式語言那麼具體。要深入的認識它,應該先從它的應用入手,選擇一種你需要的用途,然後再學習如何使用。
XML 用於描述數據,其焦點是數據是什麼。 XML 檔案描述了資料的結構。
在 XML 中,沒有預先定義的標籤。您必須定義自己的標籤。
如需學習更多關於 XML 的知識,請造訪我們的 XML 教學。
Expat 是什麼?
Expat是一個串流導向的解析器。您註冊的解析器回呼(或handler)功能,然後開始搜尋它的文件。當解析器識別該檔案的指定的位置,它會呼叫該部分對應的處理程序(如果您已經註冊的一個)。該檔案被傳送到解析器,會分割成多個片斷,並分段裝到記憶體中。因此expat可以解析那些龐大的文件。
如需讀取和更新 - 建立和處理 - 一個 XML 文檔,您需要 XML 解析器。
有兩種基本的 XML 解析器類型:
· 以樹為基礎的解析器:此解析器將 XML 文件轉換為樹型結構。它分析整篇文檔,並提供了對樹中元素的訪問,例如文檔物件模型 (DOM)。
· 以事件為基礎的解析器:將 XML 文件視為一連串的事件。當某個特定的事件發生時,解析器會呼叫函數來處理。
Expat 解析器是基於事件的解析器。
基於事件的解析器集中在 XML 文件的內容,而不是它們的結構。正因為如此,基於事件的解析器能夠比基於樹的解析器更快存取資料。
請看下面的XML 片段:
<from>Jani</from>
基於事件的解析器把上面的XML 報告為一連串的三個事件:
· 開始元素:from
· 開始CDATA 部分,值:Jani
· 良好的XML。不過這個實例是無效的 XML,因為沒有與它關聯的文件類型聲明 (DTD)。
然而,在使用 Expat 解析器時,這沒有區別。 Expat 是不檢查有效性的解析器,忽略任何 DTD。
作為一款基於事件、非驗證的 XML 解析器,Expat 快速且輕巧,十分適合 PHP 的 Web 應用程式。
註解:XML 文件必須形式良好,否則 Expat 會產生錯誤。
安裝
XML Expat 解析器函數是 PHP 核心的組成部分。無需安裝就可以使用這些函數。
XML 檔案
下面的XML 檔案將會套用在我們的實例中:
<?xml version="1.0" encoding=" ISO-8859-1"?>
<note> <to>Tove</to>
<from>Jani</from>
<heading>Reminder</ heading>
<body>Don't forget me this weekend!</body>
</note>
初始化XML 解析器
我們要在PHP 中初始化XML 解析器,為不同的XML 事件定義處理器,然後解析這個XML 檔案。 實例###<?php //Initialize the XML parser $parser=xml_parser_create(); //Function to use at the start of an element function start($parser,$element_name,$element_attrs) { switch($element_name) { case "NOTE": echo "-- Note --<br>"; break; case "TO": echo "To: "; break; case "FROM": echo "From: "; break; case "HEADING": echo "Heading: "; break; case "BODY": echo "Message: "; } } //Function to use at the end of an element function stop($parser,$element_name) { echo "<br>"; } //Function to use when finding character data function char($parser,$data) { echo $data; } //Specify element handler xml_set_element_handler($parser,"start","stop"); //Specify data handler xml_set_character_data_handler($parser,"char"); //Open XML file $fp=fopen("test.xml","r"); //Read data while ($data=fread($fp,4096)) { xml_parse($parser,$data,feof($fp)) or die (sprintf("XML Error: %s at line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser))); } //Free the XML parser xml_parser_free($parser); ?>###以上程式碼將輸出:###
-- Note --
To: Tove
From: Jani
Heading: Reminder
Message: Don't forget me this weekend!
工作原理:
1. 透過xml_parser_create() 函數初始化XML 解析器
2. 建立配合不同事件處理程序的的函數
3. 新增xml_set_element_handler() 定義,當解析器遇到開始和結束標籤時執行哪個函數
4. 在新增xml_set_character_data_handler() 函數來定義,當解析器遇到字元資料時執行哪個函數
5. 透過xml_parse()函數來解析檔案"test.xml"
6. 萬一有錯誤的話,加上xml_error_string() 函數把XML 錯誤轉換成文字說明
7. 呼叫xml_parser_free() 函數來釋放分配給xml_parser_create() 函數的內存
更多PHP Expat 解析器的信息
如需了解更多關於PHP Expat 函數的信息,請訪問我們的PHP XML Parser 參考手冊。