搜尋
首頁後端開發XML/RSS教程XML基礎講解之結構與語法

XML基礎講解之結構與語法

Mar 19, 2017 pm 03:40 PM
phpphp教程影片教學

[導讀] 現在我們暫且使用記事本來建立我們的xml檔吧。先看一個XML檔:  例1  〈?xml version="1 0" encoding="gb2312" ?〉   〈參考資料〉    〈書〉    〈#〉XML入門資料〉    〈書籍〉## 我們解題、現在說明、入門、入門、入門名稱 入門」「「」」名稱」、「現在」。使用「記事本」來建立我們的xml檔吧。先看一個XML檔:

  例1

  
#

〈?xml version="1.0" encoding="gb2312" ?〉 
  〈参考资料〉 
   〈书籍〉 
   〈名称〉XML入门精解〈/名称〉 
   〈作者〉张三〈/作者〉 
   〈价格 货币单位="人民币"〉20.00〈/价格〉 
   〈/书籍〉 
   〈书籍〉 
   〈名称〉XML语法〈/名称〉 
   〈!--此书即将出版--〉 
   〈作者〉李四〈/作者〉 
   〈价格 货币单位="人民币"〉18.00〈/价格〉 
   〈/书籍〉 
  〈/参考资料〉



  這是一個典型的XML文件,編輯好後保存為一個以.xml為後綴的文件。我們可以將此文件分為文件序言(PRolog)和文件主體兩個大的部分。在此文件中的第一行即是文件序言。該行是XML檔案必須聲明的東西,而且也必須位於XML檔案的第一行,它主要是告訴XML解析器如何運作。其中,version是標明此XML檔案所用的標準的版本號,必須要有;encoding指明了此XML檔案中所使用的字元類型,可以省略,在你省略此聲明的時候,後面的字元碼必須是Unicode字元碼(建議不要省略)。因為我們在這個例子中使用的是GB2312字元碼,所以encoding這個聲明也不能省略。在文件序言部分還有一些聲明語句,我們在後面給予介紹。

  文件的其餘部分都是屬於文件主體,XML文件的內容資訊存放在此。我們可以看到,文件主體是由開始的〈參考資料〉和結束的〈/參考資料”控制標記所組成,這個稱為XML文件的「根元素」;〈書〉是作為直屬於根元素下的“子元素」;在〈書本〉下又有〈名稱〉、〈作者〉、〈價格〉這些子元素。貨幣單位是〈價格〉元素中的一個“屬性”,而“人民幣”則是“屬性值”。

  〈!--此書即將出版--〉這一句同HTML一樣,是註釋,在XML文件裡,註釋部分是放在「〈!--〉與「--〉」標記之間的部分。

  大家可以看到,XML檔案是相當簡單的。就像HTML一樣,XML檔案也是由一系列的標記組成,不過,XML檔案中的標記是我們自訂的標記,具有明確的意義,我們可以對標記中的內容的含義作出說明。

  對XML檔案有了初步的印象之後,我們就來詳細地談一談XML檔案的語法。在講語法之前,我們必須要了解一個重要的概念,就是XML解析器(XML Parse)。

  1.XML解析器

  解析器的主要功能就是檢查XML檔案是否有結構上的錯誤,剝離XML檔案中的標記,讀出正確的內容,以交給下一步的應用程式處理。 XML是一種用來結構化檔案資訊的標記語言,XML規格中對於如何標記檔案的結構性有一個詳細的法則,解析器就是根據這些法則寫成的軟體(多用java寫成)。就像HTML一樣,在瀏覽器中,必須有HTML的解析器,這樣瀏覽器才能夠「讀懂」各種用HTML標記所組成的網頁,將它們顯示在我們面前。如果有瀏覽器的HTML解析器讀不懂的標記,將會回傳給我們錯誤訊息。

  由於現在的HTML標記實際上相當混亂,存在大量不規範的標記(有的網頁用IE能正常顯示,而用Netscape Navigator則不行),所以從一開始,XML的設計者就嚴格規定了XML的語法和結構,我們寫的XML檔案必須遵循這些規定,否則XML解析器將毫不留情地給你顯示錯誤訊息。

  有兩種XML文件,一種是Well-Formed XML文件,一種是Validating XML檔。

  如果一個XML檔案符合XML規範中的某些相關法則,且沒有使用DTD(檔案格式定義-後詳述)時,可稱這份文件為Well-Formed。而如果一個XML檔是Well-Formed,且正確地使用了DTD,DTD中的語法又是正確的,那麼這個檔就是Validating。對應兩種XML文件,有兩種XML解析器,一種是Well-Formed 解析器,一種是Validating解析器。 IE 5中就內含Validating解析器,Validating解析器也可用來解析Well-Formed XML檔。

  檢查它是否滿足了Well-Formed的條件。我們可以將剛才編輯的第一個XML 檔案用IE 5以上版本的瀏覽器開啟。

  大家可能要問為什麼在瀏覽器中的顯示和我的來源檔案一樣?沒錯,因為對於XML文件,我們黿齬匭乃 的內容,而它的顯示形式是交給CSS或XSL來完成的。這裡,我們並沒有給這個XML文件定義它的CSS或XSL文件,所以它按照原來的形式來顯示。實際上,對於電子資料交換,僅僅需要一個XML檔案即可,如果要將它以某種形式顯示出來,我們就必須編輯CSS或XSL檔案(這個問題會在以後討論)。

  2.Well-Formed的XML檔案

  我們知道,XML必須是Well-Formed的,才能夠被解析器正確地解析出來,顯示在瀏覽器中。那什麼是Well-Formed的XML檔呢?主要有下面幾個準則,我們在建立XML檔案的時候,必須滿足它們。

  首先,XML檔案的第一行必須是宣告該檔案是XML檔案以及它所使用的XML規格版本。在文件的前面不能夠有其它元素或註釋。

  第二,在XML檔案中有且只能夠有一個根元素。在我們的第一個例子中,〈參考資料〉... 〈/參考資料”就是此XML檔的根元素。

  第三,在XML檔案中的標記必須正確地關閉,也就是說,在XML檔案中,控制標記必 須有與之對應的結束標記。如:〈名稱〉標記必須有對應的〈/名稱〉結束標記,不像HTML,某些標記的結束標記可有可無。如果在XML檔案中遇到自成一個單元的標記,就是類似於HTML 中的〈img src=.....〉的這些沒有結束標記的時候,XML稱它為“空元素”,必須用這樣的寫法:〈空元素名/〉,若元素中含有屬性時寫法則為:〈空元素名屬性名=「屬性值」/〉。

  第四,標記之間不得交叉。在先前的HTML檔中,可以這樣寫:

  〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉

  標記之間有相互重疊的區域,而在XML中,是嚴格禁止這樣標記交錯的寫法,標記必須以規則性的次序來出現。

  第五,屬性值必須用「 」號括起來。如第一個例子中的「1.0」、「gb2312」、「人民幣」。都是用「 」號括起來了的,不能漏掉。

  第六,控制標記、指令和屬性名稱等英文要區分大小寫。與HTML不同的是,在HTML中,類似〈B〉和〈b〉的標記意義是一樣的,而在XML中,類似〈name〉、〈NAME〉或〈Name〉這樣的標記是不同的。

  第七,我們知道,在HTML檔案中,如果我們要瀏覽器原封不動地將我們所輸入的東西顯示出來,可以將這些東西放到〈pre〉〈/pre〉或〈 xmp〉〈/xmp〉標記中間。這對於我們建立HTML教學的網頁是必不可少的,因為網頁中要顯示HTML的原始碼。而在XML中,要實現這樣的功能,就必須使用CDATA標記。在CDATA標記中的信息被解析器原封不動地傳給應用程序,並且不解析該段資訊中的任何控制標記。 CDATA區域是由:「〈![CDATA[”開始標記,以「>」為結束標記。例如:例2中的源碼,除了“〈![CDATA[”和“>””符號,其餘的內容解析器將原封不動地交給下游的應用程序,即使CDATA區域中的開始和結尾的空白以及換行字元等,都同樣會被轉交(注意CDATA是大寫的字元)。

  例2

  〈![CDATA[飛翔的xml”〉>〉,:-)
  oooo〈〈〈〉〈〈
〉  〉〉〉〉
##  oooo〈〈〈〈〉〈〉##〉 〉〉〉



##  >〉

#  第八,XML處理空白字元和HTML不一樣。 HTML標準規定,不管有多少個空白,都當作一個空白來處理;而在XML中規定,所有標記以外的空白,解析器都要忠實地交給下游的應用程式處理。這樣,我們有時必須摒棄編寫HTML檔案時的縮排習慣,因為縮排的空格,解析器也要處理。如:

   〈作者〉張三〈/作者〉
  與
   〈作者〉
   張三
   〈作者〉
   張三
   〈/作者〉

      者作者>
##   來說是不同的(後者在〈作者〉〈/作者〉標記之內除了張三這個字符以外,還包括兩個換行記號以及“張三”前的文字縮排符號)。所以解析器在去掉標記後將資訊傳給應用程式會有不同的處理結果。

  如果我們想明確地告訴XML程序,標記中的空白有明確的含義,不要隨便去掉(如在一些詩中,空格有它具體的意義),則可在標記中加入一個XML內建的屬性——xml:space 。如(注意屬性名稱和值的大小寫):   

  〈詩 xml:space="preserver"〉
   祖國啊! 祖國!
   我的祖國!
   〈/詩〉

  另外,在XML檔中,如果要用到表1的特殊字符,必須用對應符號代替。

  表1

  特殊字元替代符號
  && ##   >###  」 "##  > ####  在此做個小結:符合上述規定的XML檔案就是Well-Formed的XML檔。這是編寫XML檔案最基本的要求。可以看到XML檔的語法規定比HTML嚴格多了。由於有這樣的嚴格規定,軟體工程師編寫XML的解析器就容易多了,不像編寫HTML語言的解析器,必須費盡心思去適應不同的網頁寫法,提升自己瀏覽器的適應力。實際上,這對我們初學者來說,也是一件好事。怎樣就怎樣,不必像原來那樣去疑惑各種HTML的寫法。 ######  我們看到,在XML檔案中,用的大多都是自訂的標記。但大家考慮一下,如果兩個同產業的公司A和B要用XML檔案互相交換數據,A公司用〈價格〉標記來表示他們產品的價格訊息,而B公司可能用〈售價〉來表示價格資訊.如果一個XML應用程式來讀取他們各自的XML檔案中的信息時,如果它只知道〈價格〉標記裡表示的是價格信息,那麼B公司的價格信息就讀不出來,必將產生錯誤。顯然,對於想利用XML檔案來交換資訊的實體來說,他們之間必須有一個約定——即編寫XML檔案可以用哪些標記,母元素中能夠包括哪些子元素,各個元素出現的順序,元素中的屬性怎樣定義等。這樣他們在用XML交換資料時才能夠暢通無阻。這種約定稱為DTD(Document Type Definition,文件格式定義)。可以把DTD看成編寫XML檔的模板。對於同行業之間的XML資料交換,有一個固定的DTD將會方便很多。比如說,如果網路上的各大電子商場的XML網頁都遵循同一個DTD時,那麼我們就可以輕鬆地依據這個DTD 編寫一個應用程序,去網上將我們感興趣的東西自動抓回來。事實上已經有了好幾個定義好的DTD,如前面所說的MathML、SMIL等。

  如果一個XML檔案是Well-Formed的,並且它是正確的依據某個DTD建立的,那麼,這個XML檔案就被稱為:Validating XML檔。對應的解析器就稱為:Validating Parser。                        

以上是XML基礎講解之結構與語法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
RSS文檔:Web聯合組織的基礎RSS文檔:Web聯合組織的基礎Apr 18, 2025 am 12:04 AM

RSS文檔是基於XML的結構化文件,用於發布和訂閱頻繁更新的內容。它的主要作用包括:1)自動化內容更新,2)內容聚合,3)提高瀏覽效率。通過RSSfeed,用戶可以訂閱並及時獲取來自不同來源的最新信息。

解碼RSS:內容提要的XML結構解碼RSS:內容提要的XML結構Apr 17, 2025 am 12:09 AM

RSS的XML結構包括:1.XML聲明和RSS版本,2.頻道(Channel),3.條目(Item)。這些部分構成了RSS文件的基礎,允許用戶通過解析XML數據來獲取和處理內容信息。

如何解析和利用基於XML的RSS提要如何解析和利用基於XML的RSS提要Apr 16, 2025 am 12:05 AM

RSSFEEDSUSEXMLTOSYNDICATECONTENT; PARSINGTHEMINVOLVESLOADINGINGINGINGINSSTRUCTURE,andExtractingData.ApplicationsIncludeBuildBuildingNewSagGregatorSaterNewSagGregatorSator andTrackingPodcastepodcastepisodes。

RSS文檔:他們如何提供您喜歡的內容RSS文檔:他們如何提供您喜歡的內容Apr 15, 2025 am 12:01 AM

RSS文檔的工作原理是通過XML文件發佈內容更新,用戶通過RSS閱讀器訂閱並接收通知。 1.內容髮布者創建並更新RSS文檔。 2.RSS閱讀器定期訪問並解析XML文件。 3.用戶瀏覽和閱讀更新內容。使用示例:訂閱TechCrunch的RSS源,只需複制鏈接到RSS閱讀器中即可。

用XML建造供稿:RSS的動手指南用XML建造供稿:RSS的動手指南Apr 14, 2025 am 12:17 AM

使用XML構建RSSfeed的步驟如下:1.創建根元素並設置版本;2.添加channel元素及其基本信息;3.添加條目(item)元素,包括標題、鏈接和描述;4.轉換XML結構為字符串並輸出。通過這些步驟,你可以從零開始創建一個有效的RSSfeed,並通過添加額外的元素如發布日期和作者信息來增強其功能。

創建RSS文檔:逐步教程創建RSS文檔:逐步教程Apr 13, 2025 am 12:10 AM

創建RSS文檔的步驟如下:1.使用XML格式編寫,根元素為,包含元素。 2.在內添加、、等元素描述頻道信息。 3.添加元素,每個代表一個內容條目,包含、、、等。 4.可選地添加和元素,豐富內容。 5.確保XML格式正確,使用在線工具驗證,優化性能並保持內容更新。

XML在RSS中的作用:聯合內容的基礎XML在RSS中的作用:聯合內容的基礎Apr 12, 2025 am 12:17 AM

XML在RSS中的核心作用是提供一種標準化和靈活的數據格式。 1.XML的結構和標記語言特性使其適合數據交換和存儲。 2.RSS利用XML創建標準化格式,方便內容共享。 3.XML在RSS中的應用包括定義feed內容的元素,如標題和發布日期。 4.優勢包括標準化和可擴展性,挑戰包括文件冗長和嚴格語法要求。 5.最佳實踐包括驗證XML有效性、保持簡潔、使用CDATA和定期更新。

從XML到可讀的內容:揭開RSS feed的神秘面紗從XML到可讀的內容:揭開RSS feed的神秘面紗Apr 11, 2025 am 12:03 AM

rssfeedsarexmldocuments usedforcontentAggregation and distribution.totransformthemintoreadableContent:1)parsethethexmlusinglibrarieslibrariesliblarieslikeparserinparserinpython.2)andledifferentifferentrssssssssssssssssssssssssssssssssssssssssssssssersions andpotentionparsingrorS.3)

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。