首頁  >  文章  >  後端開發  >  XML入門的常見問題(三)

XML入門的常見問題(三)

黄舟
黄舟原創
2016-12-22 17:38:201970瀏覽

如何載入有外國和特殊字元的文檔?

  文件可以包含外國字符,例如:


   foreign characters (úóí?) 


  例如 磲 的外國字符序列。外國字元可以是 UTF-8 編碼或用不同編碼指定,如下所示:


   foreign characters (磲) 


  現在可以正確載入了。

  其他字元是保留在 XML 中的,並且需要以不同的方式處理。以下的 XML:


   This & that
  產生以下錯誤:
  此處不允許有空格。
  行0000001: This & that
  位置  0000012: ----------^


  位置  0000012: ----------^


  位置。您需要替換稱為“實體”的特殊字元序列。

  This & that
  下面的字符需要對應的實體:


    『& & 引號字元被用作標記中屬性值的定界符,因此通常不能在屬性值的內部使用。例如,下面的內容將傳回錯誤:

  此處的單引號既用作屬性定界符,又在屬性值本身。為了修正這個問題,可以將屬性定界符換成雙引號:

  或可以將單引號轉義為實體 '

  上述兩種方式都會透過 XML 物件模型中的 getAttribute 方法傳回屬性值 John's Stuff。同樣,對於雙引號,您可以使用實體

  "。

  也可以透過將文字放在CDATA 節中來處理元素內容中的特殊字元。下面的內容是正確的:


  在本範例模型中,XML 物件模型將CDATA 節點顯示xml 節點的子節點,它將返回字符串

  This & that  is just "text" content.

  作為nodeValue。

  如何在Visual Studio 6.0 C++ 中使用MSXML COM 組件?

  在Visual C++ 6.0 中使用MSXML COM 元件最簡單的方式是使用#import 指令:

  #import "msxml.dll" named_guids no_namespace#import "msxml.dll" named_guids no_namespace

 IX 可以定義了所有介面*的介面並定義它在應用程式中使用它們了。 :


   Copyright ? 2000, Microsoft Inc, All rights reserved.

  它產生下列錯誤:

碼: xC00CE002
  Copyright ?2000, ...

  ----------------------^


  這是因為XML 只有五個內建實體。請參閱如何載入有外國和特殊字元的文件?包括在DOCTYPE 標記中,如下所示:



   Copyright ? 2000, Microsoft Inc, All rights reserved.

 

  頁要載入它,需要將它貼上並貼上測試到下載的屬性。 」中,關閉DTD 驗證,然後按一下「驗證」。請注意文件將加載,並且版權字元將顯示在validator 頁面的末尾的DOM 樹中。

  如果已經完成了DTD 驗證,那麼必須將作為參數實體的HTML 實體包括在現有的DTD 中,如下所示:

   %HTMLENT;
 〜%HTMLENT〜%HTMLENT]% 將它定義為一切以便在XML 文件中使用它們。

  在元素內容中如何處理空白字元?

  XML DOM 有三種存取元素文字內容的方式:

  屬性 行為

  nodeValue 按照原始的 XML 來源中指定的那樣,傳回 TEXT、CDATA、COMMENT 和 PI 節點上的原始文字內容(包括空白字元)。對於 ELEMENT 節點和 DOCUMENT 本身,則傳回空值。

  資料 與 nodeValue 相同

  文字 重複連接指定子樹中的多個 TEXT 和 CDATA 節點並傳回組合結果。

  注意: 空白字元包括新行、tab 和空格。

  nodeValue 屬性通常傳回原始文件中的內容,與文件如何載入和目前 xml:space 範圍無關。

  文字屬性連接指定子樹中的所有文字並擴展實體。這與文件如何載入、PReserveWhiteSpace 開關的目前狀態和目前 xml:space 範圍有關,請看如下所示:

  preserveWhiteSpace = true when the document is loaded 

preserveWhiteSpace=true    preserveWhiteSpace=true    preserveWhiteSpace=false  preserveWhite Space :space=default    xml:space=preserve    xml:space=default    

保留   保留確保=false    

xml:space=preserve    xml:space=default    xml:space=preserve    xml :space=default    

半保留   半保留並截斷   半保留   半保留並截斷   


 在內的保留表示半保留意味著保留了“重要的空白字元”並規範化了“不重要的空白字元”。重要的空白字元是文字內容內部的空白字元。不重要的空白字符是標記之間的空白字符,請看如下所示:

   n

  t    Janen

  tSmith     n

  tSmith     n

重要的空白字符,因為它是文字內容的一部分,因此有不可忽略的重要含義。所以在本例中,文字屬性回傳下列結果:

  狀態回傳值 

  保留"nt    JanentSmith    n"

     "

  
  半保留並截斷"Jane Smith"

  請注意「半保留」將規範化不重要的空白字符,例如,新行和tab 字符將退化為單一空格。如果變更 xml:space 屬性和 preserveWhiteSpace 開關,那麼文字屬性將會傳回對應的不同值。


  CDATA and xml:space="preserve" subtree boundaries 

  在下面的例子中,CDATA 節點或「保留」節點的內容將連接,原因是它們不參與不重要的空白字元化。例如:



   n
  t Jane n
  t     Smith     ]>n


     ]>n

   下因此「半保留並截斷」情況將回到下列內容:


  "Jane      Smith     "

  在此,且與 標記之間的不重要的空白字元將包括在內,與 CDATA 節點的內容無關。如果以下列內容取代 CDATA,那麼將傳回相同結果:

  Smith     
  實體是特殊的

  實體是作為 DTD 的一部分載入和分析的,並且顯示在 DOCTYPE 節點下。它們不一定要有任何 xml:space 範圍。例如:

   Jane n

  tn

  ">

  ]>

  &Jane]

字符不將其標記在空間範圍內。有空白字元節點。 TEXT>:Software Design Engineer

  ELEMENT: foo

  ATTRIBUTE: xml:space ="preserve"

  ENTITYREF: Jane


  請注意,在DOCTYPE 內部ENTITY 節點下顯露的DOM 樹不包含任何WHITESPACE 節點。 ="preserve" 的範圍內也是如此。 :space 屬性,或文件preserveWhiteSpace 開關必須設為true。
  有幾種方式可以處理屬性中的空白字元?

  有幾種方式可以存取屬性值。 text 屬性。

  attrNode.value
  getAttribute("name") 傳回和原始文件中完全相同的內容(和擴充的實體)。 
  attrNode.nodeTypedValue Null 
  attrNode.text 除了前導和尾部的空白字元已經截斷之外,其他與 nodeValue 相同。

  「XML 語言」規範為XML 應用程式定義了下列行為: 屬性型別傳回的文字 

  CDATA ID、IDREF、IDREFS、ENTITY、ENTITIES、NOTATION、枚舉規範在半數化規格代表將新行和tab 字元轉換為空格,但多個空格不會退化為一個空格。

 以上就是XML入門的常見問題(三)的內容,更多相關內容請關注PHP中文網(www.php.cn)!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn