搜尋
首頁後端開發php教程export_symbol php xml分析函數程式碼第1/2頁

首先我得承認我喜歡計算機標準。如果每個人都遵從這個行業的標準,網路將會是更好的媒體。使用標準化的資料交換格式才能使開放的和獨立於平台的計算模式切實可行。這就是我作為XML愛好者的原因。
幸運的是,我最愛的腳本語言不但支援XML而且對其支援正不斷加強。 PHP可以讓我迅速將XML文件發佈到互聯網上,收集XML文檔的統計信息,將XML文檔轉換成其它格式。例如,我時常用PHP的XML處理能力來管理我用XML所寫的文章和書。
本文中,我將討論任何用PHP內建的Expat解析器來處理XML文件。透過範例,我將示範Expat的處理方法。同時,範例可以告訴你
如何:
建立自己的處理函數
將XML文件轉換成你自己的PHP資料結構
介紹Expat
XML的解析器,同樣稱為XML處理器,可使程式存取XML文件的結構和內容。 Expat是PHP腳本語言的XML解析器。它同時也運用在
其它專案中,例如Mozilla、Apache和Perl。
什麼是基於事件的解析器?
XML解析器的兩種基本類型:
基於樹型的解析器:將XML文件轉換成樹型結構。這類解析器分析整篇文章,同時提供一個API來存取所產生樹的每個元素。其通
用的標準為DOM(文檔物件模式)。
基於事件的解析器:將XML文件視為一系列的事件。當一個特殊事件發生時,解析器會呼叫開發者提供的函數來處理。
基 於事件的解析器有一個XML文件的資料集中視圖,也就是說它集中在XML文件的資料部分,而不是其結構。這些解析器從頭到尾
處理文檔,並將類似於-元素的 開始、元素的結尾、特徵資料的開始等等——事件透過回呼(callback)函數報告給應用程式。以
下是一個"Hello-World"的XML文檔範例:

Hello World

基於事件的解析器將報告為三個事件:
開始元素:greeting
CDATA項目的開始,值為:Hello World
結束元素:greeting
不像基於樹型的解析器,基於事件的解析器不產生描述文件的結構。在CDATA項中,基於事件的解析器不會讓你得到父元素
greeting的資訊。
然而,它提供一個更底層的訪問,這使得可以更好地利用資源和更快地訪問。透過這種方式,就沒有必要將整個文件放入記憶體
;而事實上,整個文件甚至可以大於實際記憶體值。
Expat就是這樣的一種基於事件的解析器。當然如果使用Expat,必要時它一樣可以在PHP中產生完全的原生樹結構。
上面Hello-World的範例包括完整的XML格式。但它是無效的,因為既沒有DTD(文件類型定義)與其聯繫,也沒有內嵌DTD。
對於Expat,這並沒有區別:Expat是一個不檢查有效性的解析器,因此忽略任何與文件聯繫的DTD。但要注意的是文件仍需要完
整的格式,否則Expat(和其他符合XML標準的解析器一樣)將會隨著出錯訊息而停止。
作為不檢查有效性的解析器,Exapt的快速性和輕巧性使其十分適合互聯網程序。
編譯Expat
Expat可以編譯進PHP3.0.6版本(或以上)。從Apache1.3.9開始,Expat已經作為Apache的一部分。在Unix系統中,透過-with
-xml選項來設定PHP,你可以將其編譯入PHP。
如果你將PHP編譯為Apache的模組,而Expat將預設為Apache的一部分。在Windows中,你則必須載入XML動態連線庫。
XML範例:XMLstats
了解Expat的函數的一個方法就是透過範例。我們要討論的範例是使用Expat來收集XML文件的統計資料。
對於文件中每個元素,以下資訊都會被輸出:
該元素在文件中使用的次數
該元素中字元資料的數量
元素的父元素
元素的子元素
注意:為了演示,我們利用PHP來產生一個結構來保存元素的父元素和子元素
準備
用於產生XML解析器實例的函數為xml_parser_create()。該實例將用於以後的所有函數。這個想法非常類似PHP中MySQL函數的
連接 標記。在解析文件前,基於事件的解析器通常要求你註冊回調函數-用於特定的事件發生時呼叫。Expat沒有例外事件,它
定義瞭如下七個可能事件:
對象XML解析函數描述
元素xml_set_element_handler() 元素的開始和結束
字符數據xml_set_character_data_handler() 字符數據的開始
外部實體xml_set_external_entity_ref_handler() 外部實體出現
未解析外部實體xml_set_unparsed_entity_decl_handler() 未解析的外部實體出現
處理指令說明的出現
預設xml_set_default_handler() 其它沒有指定處理函數的事件
所有的回呼函數必須將解析器的實例作為其第一個參數(此外還有其它參數)。
對於本文最後的範例腳本。你需要注意的是它既用到了元素處理函數又用到了字元資料處理函數。元素的回呼處理函數透過
xml_set_element_handler()來註冊。
這個函數需要三個參數:
解析器的實例
處理開始元素的回調函數的名稱
處理結束元素的回呼函數的名稱
當開始解析XML文件時,回調函數必須存在。它們必須定義為與PHP手冊中所描述的原型一致。
例如,Expat將三個參數傳遞給開始元素的處理函數。在腳本範例中,其定義如下:
function start_element($parser, $name, $attrs)
第一個參數是解析器標示,第二個參數是開始元素的名稱,第三參數為包含元素所有屬性和值的陣列。
一旦你開始解析XML文檔,Expat在遇到開始元素是都會呼叫你的start_element()函數並將參數傳遞過去。
XML的Case Folding選項
用xml_parser_set_option ()函式將Case folding選項關閉。這個選項預設是開啟的,使得傳遞給處理函數的元素名稱自動轉換為
大寫。但XML對大小寫是敏感的(所以大小寫對統計XML文件是非 常重要的)。對於我們的範例,case folding選項必須關閉。
解析文檔
在完成所有的準備工作後,現在腳本終於可以解析XML文檔:
Xml_parse_from_file(),一個自定義的函數,打開參數中指定的文件,並以4kb的大小進行解析
xml_parse()和xml_parse_from_file()一樣,當發生錯誤時,即XML文件的格式不完全時,將會傳回false。
你可以使用xml_get_error_code()函數來得到最後一個錯誤的數字碼。將此數字代碼傳遞給xml_error_string()函數即可得到
錯誤的文字訊息。
輸出XML目前的行數,使得偵錯更容易。
在解析的過程中,呼叫回調函數。
描述文件結構
當解析文件時,對於Expat需要強調問題的是:如何保持文件結構的基本描述?
如前所述,基於事件的解析器本身並不會產生任何結構資訊。
不 過標籤(tag)結構是XML的重要特性。例如,元素序列表示的意思不同於<title>。也就是說,任何作 <br>者都會告訴你書名和圖名是沒有關係的,雖然它們都用到"title"這個術語。因此, 為了更有效地使用基於事件的解析器處理XML <br>,你必須使用自己的堆疊(stacks)或列表(lists)來維護文件的結構資訊。 <br>為了產生文件結構的鏡像,腳本至少需要知道目前元素的父元素。用Exapt的API是無法實現的,它只報告目前元素的事件,而沒 <br>有任何前後關係的資訊。因此,你需要建立自己的堆疊結構。 <br>腳本範例使用先進後出(FILO)的堆疊結構。透過一個數組,堆疊將保存全部的開始元素。對於開始元素處理函數,目前的元素將被 <br>array_push()函數推到堆疊的頂部。對應的,結束元素處理函數透過array_pop()將最頂的元素移走。 <br>對於序列<book><title>,棧的填充如下:
開始元素book:將"book"賦給棧的第一個元素($stack[0] )。
開始元素title:將"title"賦給堆疊的頂端($stack[1])。
結束元素title:從堆疊中將最頂端的元素移去($stack[1])。
結束元素title:從堆疊中將最頂端的元素移去($stack[0])。
PHP3.0透過一個$depth變數手動控制元素的巢狀來實現範例。這就使腳本看起來比較複雜。 PHP4.0透過array_pop()和
array_push()兩個函數來讓腳本看起來更簡潔。
收集資料
為了收集每個元素的信息,腳本需要記住每個元素的事件。透過使用一個全域的陣列變數$elements來保存文件中所有不同的元素
。陣列的項目是元素類別的實例,有4個屬性(類別的變數)
$count -該元素在文件中被發現的次數
$chars -元素中字元事件的位元組數
$parents -父元素
$childs - 子元素
正如你所看到的,將類別實例保存在陣列中是輕而易舉的。
注意:PHP的一個特性是你可以透過while(list() = each())loop遍歷整個類別結構,如同你遍歷整個對應的陣列一樣。所有的類別變
量(當你用PHP3.0時還有方法名稱)都以字串的方式輸出。
當發現一個元素時,我們需要增加其對應的記數器來追蹤它在文件中出現多少次。在對應的$elements項中的記數元素也要加一。
我們同樣要讓父元素知道目前的元素是它的子元素。因此,目前元素的名稱將會加入到父元素的$childs陣列的項目中。最後,目
前元素應該記住誰是它的父元素。所以,父元素被加入到目前元素$parents陣列的項目中。
顯示統計資訊
剩下的程式碼在$elements數組和其子數組中循環顯示其統計結果。這就是最簡單的巢狀循環,儘管輸出正確的結果,但程式碼既不簡
潔又沒有任何特別的技巧,它只是一個你可能每天用他來完成工作的循環。
腳本範例被設計為透過PHP的CGI方式的命令列來呼叫。因此,統計結果輸出的格式為文字格式。如果你要將腳本運用在網路上
,那麼你需要修改輸出函數來產生HTML格式。
總結
Exapt是PHP的XML解析器。作為基於事件的解析器,它不產生文件的結構描述。但透過提供底層訪問,這使得可以更好地利用資
來源和更快地訪問。
作為一個不檢查有效性的解析器,Expat忽略與XML文件連接的DTD,但如果文件的格式不完整,它將會隨著出錯資訊而停止。
提供事件處理函數來處理文件
建立自己的事件結構例如堆疊和樹來獲得XML結構資訊標記的優點。
每天都有新的XML程式出現,而PHP對XML的支援也不斷加強(例如,增加了支援基於DOM的XML解析器LibXML)。
有了PHP和Expat,你就可以為即將出現的有效、開放和獨立於平台的標準做好準備。

目前1/2頁 12下一頁

以上就介紹了export_symbol php xml分析函數程式碼第1/2頁,包含了export_symbol方面的內容,希望對PHP教學有興趣的朋友有幫助。

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
使用數據庫存儲會話的優點是什麼?使用數據庫存儲會話的優點是什麼?Apr 24, 2025 am 12:16 AM

使用數據庫存儲會話的主要優勢包括持久性、可擴展性和安全性。 1.持久性:即使服務器重啟,會話數據也能保持不變。 2.可擴展性:適用於分佈式系統,確保會話數據在多服務器間同步。 3.安全性:數據庫提供加密存儲,保護敏感信息。

您如何在PHP中實現自定義會話處理?您如何在PHP中實現自定義會話處理?Apr 24, 2025 am 12:16 AM

在PHP中實現自定義會話處理可以通過實現SessionHandlerInterface接口來完成。具體步驟包括:1)創建實現SessionHandlerInterface的類,如CustomSessionHandler;2)重寫接口中的方法(如open,close,read,write,destroy,gc)來定義會話數據的生命週期和存儲方式;3)在PHP腳本中註冊自定義會話處理器並啟動會話。這樣可以將數據存儲在MySQL、Redis等介質中,提升性能、安全性和可擴展性。

什麼是會話ID?什麼是會話ID?Apr 24, 2025 am 12:13 AM

SessionID是網絡應用程序中用來跟踪用戶會話狀態的機制。 1.它是一個隨機生成的字符串,用於在用戶與服務器之間的多次交互中保持用戶的身份信息。 2.服務器生成並通過cookie或URL參數發送給客戶端,幫助在用戶的多次請求中識別和關聯這些請求。 3.生成通常使用隨機算法保證唯一性和不可預測性。 4.在實際開發中,可以使用內存數據庫如Redis來存儲session數據,提升性能和安全性。

您如何在無狀態環境(例如API)中處理會議?您如何在無狀態環境(例如API)中處理會議?Apr 24, 2025 am 12:12 AM

在無狀態環境如API中管理會話可以通過使用JWT或cookies來實現。 1.JWT適合無狀態和可擴展性,但大數據時體積大。 2.Cookies更傳統且易實現,但需謹慎配置以確保安全性。

您如何防止與會議有關的跨站點腳本(XSS)攻擊?您如何防止與會議有關的跨站點腳本(XSS)攻擊?Apr 23, 2025 am 12:16 AM

要保護應用免受與會話相關的XSS攻擊,需採取以下措施:1.設置HttpOnly和Secure標誌保護會話cookie。 2.對所有用戶輸入進行輸出編碼。 3.實施內容安全策略(CSP)限制腳本來源。通過這些策略,可以有效防護會話相關的XSS攻擊,確保用戶數據安全。

您如何優化PHP會話性能?您如何優化PHP會話性能?Apr 23, 2025 am 12:13 AM

优化PHP会话性能的方法包括:1.延迟会话启动,2.使用数据库存储会话,3.压缩会话数据,4.管理会话生命周期,5.实现会话共享。这些策略能显著提升应用在高并发环境下的效率。

什麼是session.gc_maxlifetime配置設置?什麼是session.gc_maxlifetime配置設置?Apr 23, 2025 am 12:10 AM

theSession.gc_maxlifetimesettinginphpdeterminesthelifespanofsessiondata,setInSeconds.1)它'sconfiguredinphp.iniorviaini_set().2)abalanceisesneededeededeedeedeededto toavoidperformance andunununununexpectedLogOgouts.3)

您如何在PHP中配置會話名?您如何在PHP中配置會話名?Apr 23, 2025 am 12:08 AM

在PHP中,可以使用session_name()函數配置會話名稱。具體步驟如下:1.使用session_name()函數設置會話名稱,例如session_name("my_session")。 2.在設置會話名稱後,調用session_start()啟動會話。配置會話名稱可以避免多應用間的會話數據衝突,並增強安全性,但需注意會話名稱的唯一性、安全性、長度和設置時機。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)