ホームページ >バックエンド開発 >XML/RSS チュートリアル >XML コード記述におけるエンコードと検証の問題の詳細な紹介

XML コード記述におけるエンコードと検証の問題の詳細な紹介

黄舟
黄舟オリジナル
2017-03-10 19:35:501499ブラウズ

この記事では、XML コード記述のエンコーディングと検証の問題を主に紹介します。HTML と同様に、XML ファイルのエンコーディングもプリアンブルで指定できます。

エンコーディング

エンコーディングは変換することです。 Unicode 文字は、等価なバイナリ表現のプロセスです。 XML ハンドラーは XML ドキュメントを読み取るとき、エンコード タイプに基づいてドキュメントをエンコードします。したがって、XML 宣言でエンコード タイプを指定する必要があります。

エンコーディングの種類
エンコーディングには主に2種類があります:

UTF-8
UTF-16
UTFはUCS変換形式を表し、UCS自体はユニバーサル文字セットを意味します。数値 8 または 16 は、文字を表すビット数を表します。 8 (1 バイト) または 16 (2 バイト) です。エンコード情報のないドキュメントの場合は、デフォルトで UTF-8 が使用されます。

構文
エンコーディング情報は、XML ドキュメントのプロローグに含まれています。 UTF-8 エンコードの構文は次のとおりです。

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

UTF-16 エンコードの構文は次のとおりです。

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

次の例は、エンコード宣言を示しています。

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>  
  
    Tanmay Patil  
    TutorialsPoint  
    (011) 123-4567  

上記のエンコードでは="UTF-8 " この例では、文字を表現するために 8 ビットを使用するように指定されています。 16 文字を使用するには、UTF-16 エンコーディングを使用します。

UTF-8 を使用してエンコードされた XML ファイルのサイズは、UTF-16 形式の XML ファイルよりも小さくなります。

検証

検証は、XML ドキュメントを検証するプロセスです。文書は、その内容が要素、属性、および関連する文書型定義 (DTD) と一致し、文書が b で表される制約に準拠する場合に、有効であるとみなされます。 XML パーサーを使用して検証を処理するには 2 つの方法があります。

整形式の XML ドキュメント
有効な XML ドキュメント
整形式の XML ドキュメント
XML ドキュメントは、次の規則に従っている場合、整形式とみなされます。

DTD のない XML ドキュメントは、amp(&)、apos (一重引用符)、g(>)、quot (二重引用符) を処理するために、事前定義された文字エンティティを使用する必要があります。
タグの順序に従う必要があります。たとえば、外側のタグを閉じる前に内側のタグを閉じる必要があります。
すべての開始タグには終了タグが必要か、または自己終了タグ (b2386ffb911b14667cb8f0f91ea547a7...6e916e0f7d1e588d4f442bf645aedb2f または d4bce3f20dbe5ab08417432e520da517) である必要があります。
開始タグには属性を 1 つだけ含める必要があり、引用符で囲む必要があります。
amp(&)、apos (一重引用符)、g(>)、quot (二重引用符) エンティティを除き、他のエンティティは使用前に宣言する必要があります。

以下は、整形式の XML ドキュメントの例です:

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  
<!DOCTYPE address   
[   
<!ELEMENT address (name,company,phone)>  
    <!ELEMENT name (#PCDATA)>  
    <!ELEMENT company (#PCDATA)>  
    <!ELEMENT phone (#PCDATA)>  
]>  
<address>  
    <name>Tanmay Patil</name>  
    <company>TutorialsPoint</company>  
    <phone>(011) 123-4567</phone>  
</address>

上記の例は、以下の理由から整形式であると考えられます:

ドキュメント タイプを定義します。ここでのドキュメントタイプは要素タイプです。
address という名前のルート要素が含まれます。
各子要素の名前、会社、電話は、一目瞭然で正しく閉じられたタグです。
タグは正しい順序です。

以上がXML コード記述におけるエンコードと検証の問題の詳細な紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。