Heim >Backend-Entwicklung >XML/RSS-Tutorial >XML-Grundlagen: Struktur und Syntax

XML-Grundlagen: Struktur und Syntax

巴扎黑Original: 2017-03-19 15:40:301522Durchsuche

[Einleitung] Jetzt verwenden wir Notepad, um unsere XML-Datei zu erstellen. Schauen wir uns zunächst eine XML-Datei an:　　　　　　　　　　　　　　名〉 Verwenden Sie „Notepad“, um unsere XML-Datei zu erstellen. Schauen Sie sich zunächst eine XML-Datei an:

Beispiel 1

〈?xml version="1.0" encoding="gb2312" ?〉 
　　〈参考资料〉 
　　 〈书籍〉 
　　 〈名称〉XML入门精解〈/名称〉 
　　 〈作者〉张三〈/作者〉 
　　 〈价格 货币单位="人民币"〉20.00〈/价格〉 
　　 〈/书籍〉 
　　 〈书籍〉 
　　 〈名称〉XML语法〈/名称〉 
　　 〈!--此书即将出版--〉 
　　 〈作者〉李四〈/作者〉 
　　 〈价格 货币单位="人民币"〉18.00〈/价格〉 
　　 〈/书籍〉 
　　〈/参考资料〉

Dies ist eine typische XML-Datei. Speichern Sie sie nach der Bearbeitung als Datei mit dem Suffix .xml. Wir können diese Datei in zwei Hauptteile unterteilen: die Dateipräambel (PRolog) und den Dateikörper. Die erste Zeile in dieser Datei ist die Dateipräambel. Diese Zeile muss eine XML-Datei deklarieren und muss sich auch in der ersten Zeile der XML-Datei befinden. Sie sagt dem XML-Parser hauptsächlich, wie er arbeiten soll. Unter anderem ist Version die von dieser XML-Datei verwendete Standardversionsnummer, die erforderlich ist; die Codierung gibt den in dieser XML-Datei verwendeten Zeichentyp an, der weggelassen werden kann. Wenn Sie diese Anweisung weglassen, muss der folgende Zeichencode ein Unicode-Zeichencode sein (Es wird empfohlen, es nicht wegzulassen). Da wir in diesem Beispiel den GB2312-Zeichencode verwenden, kann die Codierungsanweisung nicht weggelassen werden. Es gibt auch einige Deklarationsanweisungen in der Präambel der Datei, die wir später vorstellen werden.

Der Rest der Datei gehört zum Dateikörper und die Inhaltsinformationen der XML-Datei werden hier gespeichert. Wir können sehen, dass der Hauptteil der Datei aus den ersten - und den endenden -Kontrolltags besteht. Dies wird als „Stammelement“ der XML-Datei bezeichnet. direkt unter dem Wurzelelement „Unterelement“; unter „Buch“ gibt es Unterelemente wie „Name“, „Autor“ und „Preis“. Die Währungseinheit ist ein „Attribut“ im Element und „RMB“ ist der „Attributwert“.

　〈!--Dieses Buch wird bald veröffentlicht--〉Dieser Satz ist derselbe wie HTML, es ist ein Kommentar. In der XML-Datei wird der Kommentarteil zwischen „〈!--“ platziert. und „--〉“-Tags zwischen Teilen.

Wie Sie sehen, sind XML-Dateien recht einfach. Wie HTML bestehen auch XML-Dateien aus einer Reihe von Tags. Die Tags in XML-Dateien sind jedoch unsere eigenen benutzerdefinierten Tags und haben eine klare Bedeutung des Inhalts der Tags.

Nachdem wir einen ersten Eindruck von XML-Dateien gewonnen haben, sprechen wir im Detail über die Syntax von XML-Dateien. Bevor wir über Grammatik sprechen, müssen wir ein wichtiges Konzept verstehen, nämlich XML Parse.

1. XML-Parser

Die Hauptfunktion des Parsers besteht darin, zu prüfen, ob Strukturfehler in der XML-Datei vorliegen, die Tags in der XML-Datei zu entfernen, den korrekten Inhalt zu lesen und zu übergeben Weiter geht es mit der nächsten One-Step-Antragsbearbeitung. XML ist eine Auszeichnungssprache, die zum Strukturieren von Dateiinformationen verwendet wird. Die XML-Spezifikation enthält detaillierte Regeln zum Markieren der Struktur von Dateien. Der Parser ist eine nach diesen Regeln geschriebene Software (meistens in Java geschrieben). Genau wie bei HTML muss im Browser ein HTML-Parser vorhanden sein, damit der Browser verschiedene Webseiten, die aus HTML-Tags bestehen, „lesen“ und vor uns anzeigen kann. Wenn es Tags gibt, die der HTML-Parser des Browsers nicht lesen kann, wird eine Fehlermeldung an uns zurückgegeben.

Da die aktuellen HTML-Tags eigentlich ziemlich verwirrend sind und es viele nicht standardmäßige Tags gibt (einige Webseiten können normal mit IE angezeigt werden, aber nicht mit Netscape Navigator), also von Anfang an die Designer von XML Die Syntax und Struktur von XML sind streng vorgeschrieben. Die von uns geschriebenen XML-Dateien müssen diesen Vorschriften entsprechen, sonst zeigt Ihnen der XML-Parser gnadenlos Fehlermeldungen an.

Es gibt zwei Arten von XML-Dateien: eine ist die wohlgeformte XML-Datei und die andere ist die validierende XML-Datei.

Wenn eine XML-Datei bestimmte relevante Regeln in der XML-Spezifikation erfüllt und keine DTD (Dokumentformatdefinition – Details später) verwendet, kann sie als wohlgeformt bezeichnet werden. Und wenn eine XML-Datei wohlgeformt ist, die DTD korrekt verwendet wird und die Syntax in der DTD korrekt ist, dann ist die Datei validierend. Entsprechend den beiden XML-Dateien gibt es zwei XML-Parser, einen ist der wohlgeformte Parser und der andere ist der validierende Parser. IE 5 enthält einen Validierungsparser, der auch zum Parsen wohlgeformter XML-Dateien verwendet werden kann.

Überprüfen Sie, ob es die Bedingungen von Well-Formed erfüllt. Wir können die erste XML-Datei, die wir gerade bearbeitet haben, mit einem Browser von IE 5 oder höher öffnen.

Sie fragen sich vielleicht, warum die Anzeige im Browser mit meiner Quelldatei übereinstimmt? Das ist richtig, denn bei XML-Dateien kennen wir nur den Inhalt und seine Anzeigeform wird durch CSS oder XSL vervollständigt. Hier haben wir für diese XML-Datei keine CSS- oder XSL-Datei definiert, daher wird sie in ihrer ursprünglichen Form angezeigt. Tatsächlich ist für den elektronischen Datenaustausch nur eine XML-Datei erforderlich. Wenn wir sie in irgendeiner Form anzeigen möchten, müssen wir die CSS- oder XSL-Datei bearbeiten (dieses Problem wird später besprochen).

2. Wohlgeformte XML-Datei

Wir wissen, dass XML wohlgeformt sein muss, um vom Parser korrekt analysiert und im Browser angezeigt zu werden. Was ist also eine wohlgeformte XML-Datei? Bei der Erstellung von XML-Dateien müssen vor allem die folgenden Richtlinien beachtet werden.

Zunächst muss in der ersten Zeile der XML-Datei angegeben werden, dass es sich bei der Datei um eine XML-Datei handelt und welche XML-Spezifikationsversion sie verwendet. Vor der Datei dürfen keine anderen Elemente oder Kommentare stehen.

Zweitens kann es in einer XML-Datei nur ein Stammelement geben. In unserem ersten Beispiel ist 〈References〉... 〈/References〉 das Wurzelelement dieser XML-Datei.

Drittens müssen die Tags in der XML-Datei korrekt geschlossen werden, d. h. in der XML-Datei muss das Kontroll-Tag über ein entsprechendes schließendes Tag verfügen. Beispiel: Das -Tag muss über ein entsprechendes schließendes Tag verfügen. Im Gegensatz zu HTML ist das schließende Tag einiger Tags optional. Wenn Sie in einer XML-Datei auf ein eigenständiges Unit-Tag stoßen, das XML-Grundlagen: Struktur und Syntax in HTML ohne End-Tag ähnelt, nennt XML es ein „leeres Element“ und Sie müssen die Schreibmethode verwenden lautet: 〈leerer Elementname/〉 Wenn das Element Attribute enthält, lautet die Schreibmethode: 〈leerer Elementname Attributname = „Attributwert“/〉.

Viertens dürfen sich die Markierungen nicht kreuzen. In der vorherigen HTML-Datei können Sie so schreiben:

　〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉 und 〈H〉

Es gibt Überlappungen Bereiche, aber in XML ist es strengstens verboten, solche verschachtelten Tags zu schreiben, und Tags müssen in einer regelmäßigen Reihenfolge erscheinen.

Fünftens müssen Attributwerte in „“-Zeichen eingeschlossen werden. Zum Beispiel „1.0“, „gb2312“, „RMB“ im ersten Beispiel. Sie sind alle durch „ “ umschlossen und können nicht übersehen werden.

Sechstens muss bei englischen Steuer-Tags, Anweisungen und Attributnamen die Groß-/Kleinschreibung beachtet werden. Im Gegensatz zu HTML haben in HTML Tags wie und die gleiche Bedeutung, während in XML Tags wie , oder unterschiedlich sind.

Siebtens wissen wir, dass wir in HTML-Dateien, wenn wir möchten, dass der Browser die von uns eingegebenen Dinge intakt anzeigt, diese Dinge in die Markierungen 〈pre〉〈/pre〉 oder 〈xmp〉〈/xmp〉 einfügen können die Mitte. Dies ist für die Erstellung von HTML-Unterrichtswebseiten für uns unerlässlich, da der HTML-Quellcode auf der Webseite angezeigt werden muss. Um eine solche Funktion in XML zu implementieren, müssen CDATA-Tags verwendet werden. Die Informationen im CDATA-Tag werden vom Parser intakt an die Anwendung übergeben und alle Steuertags im Informationssegment werden nicht analysiert. Der CDATA-Bereich ist durch „
Beispiel 2

　〈![CDATA[flying xml〉〉〉〉〉,:-)
oooo〈〈〈〈〈〈〈
　>〉

Achtens behandelt XML Leerzeichen anders als HTML. Der HTML-Standard schreibt vor, dass Leerzeichen unabhängig von der Anzahl als ein einziges Leerzeichen behandelt werden, während in XML festgelegt ist, dass der Parser alle Leerzeichen außer Tags ordnungsgemäß zur Verarbeitung an nachgelagerte Anwendungen übergeben muss. Auf diese Weise müssen wir beim Schreiben von HTML-Dateien manchmal die Einrückungsgewohnheit aufgeben, da der Parser auch die eingerückten Leerzeichen verarbeiten muss. Zum Beispiel:

〈Author〉Zhang San〈/Author〉
und
〈Author〉
Zhang San
〈/Author>

Der obige Inhalt ist für den Parser ist anders (letzterer enthält zusätzlich zum Zeichen Zhang San im -Tag auch zwei Zeilenumbruchzeichen und das Texteinrückungssymbol vor „Zhang San“). Daher wird der Parser nach dem Entfernen der Markierung und der Übergabe der Informationen an die Anwendung unterschiedliche Verarbeitungsergebnisse erzielen.

Wenn wir dem XML-Programm klar mitteilen möchten, dass die Leerzeichen in den Tags eine klare Bedeutung haben und nicht einfach so entfernt werden sollten (in einigen Gedichten haben Leerzeichen beispielsweise eine bestimmte Bedeutung), können wir ein XML-Tag hinzufügen zu den Tags Integriertes Attribut - xml:space. Zum Beispiel (beachten Sie die Groß- und Kleinschreibung von Attributnamen und -werten): 　

　　Poetry xml:space="preserver"〉
　 Motherland! Heimat!
Mein Mutterland!
　〈/Poem>

Darüber hinaus müssen in der XML-Datei die Sonderzeichen in Tabelle 1 durch entsprechende Symbole ersetzt werden, wenn sie verwendet werden sollen.

Tabelle 1

Ersetzungssymbole für Sonderzeichen
&& &
>
Lassen Sie mich hier eine Zusammenfassung machen: Die XML-Datei, die die oben genannten Anforderungen erfüllt, ist die wohlgeformte Datei XML-Datei. Dies ist die grundlegendste Voraussetzung zum Schreiben von XML-Dateien. Sie sehen, dass die Syntax von XML-Dateien viel strenger ist als die von HTML. Aufgrund dieser strengen Vorschriften ist es für Softwareentwickler viel einfacher, XML-Parser für die HTML-Sprache zu schreiben. Sie müssen hart daran arbeiten, sich an verschiedene Methoden zum Schreiben von Webseiten anzupassen und die Anpassungsfähigkeit ihrer eigenen Browser zu verbessern. Tatsächlich ist das auch für uns Anfänger eine gute Sache. Machen Sie einfach, was Sie wollen, und müssen Sie sich nicht wie zuvor Gedanken darüber machen, wie Sie verschiedene HTMLs schreiben.

Wir sehen, dass in XML-Dateien die meisten benutzerdefinierten Tags verwendet werden. Aber denken Sie darüber nach: Wenn zwei Unternehmen A und B in derselben Branche mithilfe von XML-Dateien Daten miteinander austauschen möchten, verwendet Unternehmen A das -Tag, um die Preisinformationen ihrer Produkte darzustellen, während Unternehmen B möglicherweise , um die Preisinformationen darzustellen. Wenn eine XML-Anwendung die Informationen in ihren jeweiligen XML-Dateien liest und nur weiß, dass das -Tag Preisinformationen darstellt, können die Preisinformationen von Unternehmen B nicht gelesen werden und es tritt ein Fehler auf. Offensichtlich muss für Entitäten, die XML-Dateien zum Informationsaustausch verwenden möchten, eine Vereinbarung zwischen ihnen bestehen – das heißt, welche Tags zum Schreiben von XML-Dateien verwendet werden können, welche Unterelemente in das übergeordnete Element aufgenommen werden können und in welcher Reihenfolge welches Element angezeigt wird und wie die Eigenschaften definiert werden usw. Auf diese Weise können sie beim Datenaustausch mit XML reibungslos kommunizieren. Diese Konvention wird DTD (Document Type Definition, Dokumentformatdefinition) genannt. Sie können sich eine DTD als Vorlage zum Schreiben von XML-Dateien vorstellen. Für den XML-Datenaustausch zwischen derselben Branche ist es viel praktischer, eine feste DTD zu haben. Wenn beispielsweise die XML-Webseiten großer elektronischer Einkaufszentren im Internet alle derselben DTD folgen, können wir problemlos eine Anwendung basierend auf dieser DTD schreiben, um automatisch die Dinge zu erfassen, die uns online interessieren. Tatsächlich gibt es bereits mehrere gut definierte DTDs wie MathML, SMIL usw., die bereits erwähnt wurden.

Wenn eine XML-Datei wohlgeformt ist und korrekt auf der Grundlage einer DTD erstellt wurde, heißt die XML-Datei: Validierende XML-Datei. Der entsprechende Parser heißt: Validating Parser.

Das obige ist der detaillierte Inhalt vonXML-Grundlagen: Struktur und Syntax. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Häufig gestellte Fragen zum Einstieg in XML Teil 2Nächster Artikel：Häufig gestellte Fragen zum Einstieg in XML Teil 2

In Verbindung stehende Artikel

Mehr sehen