ホームページ >バックエンド開発 >XML/RSS チュートリアル >XML の基本: 構造と構文
[はじめに] 次に、メモ帳を使用して XML ファイルを作成しましょう。最初にXMLファイルを見てみましょう。まず XML ファイルを見てみましょう:
例 1
〈?xml version="1.0" encoding="gb2312" ?〉 〈参考资料〉 〈书籍〉 〈名称〉XML入门精解〈/名称〉 〈作者〉张三〈/作者〉 〈价格 货币单位="人民币"〉20.00〈/价格〉 〈/书籍〉 〈书籍〉 〈名称〉XML语法〈/名称〉 〈!--此书即将出版--〉 〈作者〉李四〈/作者〉 〈价格 货币单位="人民币"〉18.00〈/价格〉 〈/书籍〉 〈/参考资料〉
これは典型的な XML ファイルで、編集後は .xml 拡張子が付いたファイルとして保存されます。このファイルは、ファイル プリアンブル (PRolog) とファイル本体の 2 つの主要な部分に分割できます。このファイルの最初の行はファイルのプリアンブルです。この行は XML ファイルで宣言する必要があり、主に XML パーサーに動作方法を指示するものであり、XML ファイルの最初の行に配置する必要があります。このうち、version はこの XML ファイルで使用される標準のバージョン番号であり、encoding はこの XML ファイルで使用される文字の種類を指定します (省略可能)。 (省略しないことをお勧めします)。この例では文字コード GB2312 を使用しているため、encoding ステートメントは省略できません。ファイルのプリアンブルにもいくつかの宣言文がありますが、これについては後で紹介します。
ファイルの残りの部分はファイル本体に属し、XML ファイルのコンテンツ情報がここに格納されます。ファイルの本体は開始
この文章はHTMLと同じようにコメント部分を「」タグで挟みます。
ご覧のとおり、XML ファイルは非常に単純です。 HTML と同様に、XML ファイルも一連のタグで構成されていますが、XML ファイル内のタグは独自のカスタム タグであり、タグ内のコンテンツの意味を説明できます。
XML ファイルについての予備的な印象を持った後、XML ファイルの構文について詳しく話しましょう。文法について話す前に、XML 解析という重要な概念を理解する必要があります。
1.XMLパーサー
パーサーの主な機能は、XMLファイルに構造上のエラーがあるかどうかをチェックし、XMLファイル内のタグを取り除き、次のアプリケーションプログラムで処理するための正しい内容を読み出すことです。 XML は、ファイル情報を構造化するために使用されるマークアップ言語です。XML 仕様には、ファイルの構造をマークする方法に関する詳細な規則があります。パーサーは、これらの規則に従って記述されたソフトウェアです (主に Java で記述されています)。 HTML と同様に、ブラウザーが HTML タグで構成されるさまざまな Web ページを「読み取り」、それを私たちの前に表示できるように、ブラウザーにも HTML パーサーが必要です。ブラウザの HTML パーサーが読み取れないタグがある場合は、エラー メッセージが返されます。
現在の HTML タグは実際には非常に混乱しており、非標準のタグが多数あるため (一部の Web ページは IE では正常に表示できるが、Netscape Navigator では表示できない)、当初から XML の設計者は厳密に規定の XML 私たちが作成する XML ファイルの構文と構造は、これらの規定に準拠している必要があります。準拠していないと、XML パーサーは容赦なくエラー メッセージを表示します。
XML ファイルには 2 種類あり、1 つは Well-Formed XML ファイル、もう 1 つは Validating XML ファイルです。
XML ファイルが XML 仕様の特定の関連ルールを満たし、DTD (文書形式定義 - 詳細は後述) を使用していない場合、その XML ファイルは Well-Formed と呼ぶことができます。 XML ファイルが整形式であり、DTD が正しく使用され、DTD 内の構文が正しい場合、ファイルは検証中です。 2 つの XML ファイルに対応して、2 つの XML パーサーがあり、1 つは Well-Formed パーサー、もう 1 つは Validating パーサーです。 IE 5 には検証パーサーが含まれており、整形式 XML ファイルの解析にも使用できます。
Well-Formedの条件を満たしているか確認してください。編集した最初の XML ファイルは、IE 5 以降のブラウザで開くことができます。
ブラウザでの表示がソース ファイルと同じである理由を知りたいかもしれません。そうです、XML ファイルの場合は内容しか分からず、その表示形式は CSS または XSL によって完成されるからです。ここでは、この XML ファイルの CSS または XSL ファイルを定義していないため、元の形式で表示されます。実際、電子データの交換に必要なのは XML ファイルだけです。それを何らかの形式で表示したい場合は、CSS または XSL ファイルを編集する必要があります (この問題については後で説明します)。
2. 整形式の XML ファイル
パーサーによって正しく解析され、ブラウザーに表示されるためには、XML が整形式でなければならないことがわかっています。では、整形式 XML ファイルとは何でしょうか? XML ファイルを作成する際には、主に次のガイドラインを満たす必要があります。
まず、XML ファイルの最初の行で、そのファイルが XML ファイルであることと、そのファイルが使用する XML 仕様のバージョンを宣言する必要があります。ファイルの前に他の要素やコメントを置くことはできません。
次に、XML ファイル内に存在できるルート要素は 1 つだけです。最初の例では、
第三に、XML ファイル内のタグは正しく閉じられている必要があります。つまり、XML ファイル内のコントロール タグには、対応する終了タグが必要です。例:
第四に、マークは交差してはなりません。以前の HTML ファイルでは、次のように記述できます:
タグ間には重複する領域がありますが、XML では厳密に重複しています。このようなインターリーブマークを書き込むことは禁止されており、マークは規則的な順序で表示されなければなりません。
5番目に、属性値は「」記号で囲む必要があります。最初の例では「1.0」、「gb2312」、「RMB」などです。それらはすべて「 」で囲まれており、見逃すことはできません。
第六に、英語の制御タグ、命令、属性名は大文字と小文字を区別する必要があります。 HTML とは異なり、HTML では と などのタグは同じ意味を持ちますが、XML では
7番目に、HTMLファイルでは、入力したものをそのままブラウザに表示させたい場合は、これらのものをまたは
例 2
〈![CDATA[flying xml〉〉〉〉,:-)
oooo〈〈〈〈〈〈〈
>〉〉
第八に、XML は HTML とは異なる方法で空白文字を処理します。 HTML 標準では、空白がいくつあっても 1 つの空白として扱われると規定されていますが、XML では、パーサーはタグ以外のすべての空白を下流のアプリケーションに処理のために忠実に渡す必要があると規定されています。このように、パーサーはインデントされたスペースも処理する必要があるため、HTML ファイルを作成するときにインデントの習慣を放棄しなければならない場合があります。例:
by
by Zhang San by 2 つの改行記号と「Zhang San」の前のテキスト インデント記号)。したがって、タグを削除して情報をアプリケーションに渡した後のパーサーの処理結果は異なります。
タグ内のスペースには明確な意味があり、むやみに削除すべきではないことを XML プログラムに明確に伝えたい場合 (たとえば、一部の詩では、スペースに特定の意味があります)、XML 組み込み属性を追加できます。タグ - —xml:space に。例: (属性名と値の大文字化に注意してください):
詩 xml:space="preserver">
おお祖国よ! 祖国よ!
私の祖国よ!
また、XML ファイル内で表 1 の特殊文字を使用する場合は、対応する記号に置き換える必要があります。
表 1
特殊文字置換記号
&& &
1ef228590e5805ff87d1d27acad6cf03これは、XML ファイルを作成するための最も基本的な要件です。 XML ファイルの構文は HTML の構文よりもはるかに厳密であることがわかります。このような厳格な規制により、ソフトウェア エンジニアは HTML 言語のパーサーを作成するのとは異なり、Web ページのさまざまな作成方法に適応し、独自のブラウザーの適応性を向上させるために懸命に努力する必要があります。実際、これは私たち初心者にとっても良いことです。これまでのようにさまざまな HTML の書き方を気にする必要はなく、やりたいことだけを実行できます。
XML ファイルでは、ほとんどのカスタム タグが使用されていることがわかります。しかし、考えてみてください。同じ業界の 2 つの企業 A と B が XML ファイルを使用して相互にデータを交換したい場合、A 社は製品の価格情報を表すために
XML ファイルが整形式であり、DTD に基づいて正しく作成されている場合、XML ファイルは「XML ファイルの検証」と呼ばれます。対応するパーサーは、Validating Parser と呼ばれます。
以上がXML の基本: 構造と構文の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。