DTD 建置模組
DTD - XML 建置模組
#建置模組最主要的與元素是 XML 和 HTML文件。
XML 文件建構模組
所有的XML 文件(以及HTML 文件)都由以下簡單的建置模組構成:
Elements
Attributes
Entities
PCDATA
CDATA
元素
元素是XML 以及HTML 文件的主要建構模組。
HTML 元素的範例是 "body" 和 "table"。 XML 元素的例子是 "note" 和 "message" 。元素可包含文字、其他元素或是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。
實例:
# <message>some text</message>
#屬性可提供有關元素的額外資訊。
屬性總是被放在某元素的開始標籤中。屬性總是以名稱/值的形式成對出現的。下面的"img" 元素擁有關於原始檔案的額外資訊:
#元素的名稱是"img"。屬性的名稱是 "src"。屬性的值是 "computer.gif"。由於元素本身為空,它被一個 " /" 關閉。
實體
實體是用來定義普通文字的變數。實體引用是對實體的引用。
大多數同學都了解這個 HTML 實體引用:" "。這個"無折行空格"實體在 HTML 中被用來在某個文件中插入一個額外的空格。
當文件被 XML 解析器解析時,實體就會被展開。
實體應用程式 | 字元 |
---|---|
#< | ##<|
> | |
#& | |
" | |
#' |
PCDATA
PCDATA 的意思是被解析的字元資料(parsed character data)。
可把字元資料想像為 XML 元素的開始標籤與結束標籤之間的文字。
PCDATA 是會被解析器解析的文字。這些文字將被解析器檢查實體以及標記。
文字中的標籤會被當作標記來處理,而實體會被展開。
不過,被解析的字元資料不應當包含任何 &、< 或 > 字元;需要使用 &、< 以及 > 實體來分別替換它們。
CDATA
CDATA 的意思是字元資料(character data)。
CDATA 是不會被解析器解析的文字。 在這些文字中的標籤不會被當作標記來對待,其中的實體也不會被展開。