Heim >Backend-Entwicklung >XML/RSS-Tutorial >Verrückte XML-Studiennotizen (2)-------------Formatanforderungen
Syntax von XML
• Eine XML-Datei ist in folgende Teile unterteilt:
– Dokument Deklaration
– Element
– Attribute
– – CDATABereich, Sonderzeichen
– Verarbeitungshinweise (Verarbeitungshinweise)
Xml-Deklaration
Die einfachste Deklaration ist 7c7800c328d93b78ff490afe429e7435
Encoding
-Attribut: Zeichenkodierung, wenn nicht angegeben, ist die Standardeinstellung UTF-8-Kodierung
Gemeinsamer Zeichensatz Vereinfachtes Chinesisch:
GBKoder GB2312
Traditionelles Chinesisch : BIG5Westeuropäische Zeichen
: ISO8859-1Universelle internationale Kodierung
: Unicode UTF-8Demo-Fall:
b0a387856db4dd8d5522e237d781d8bc
555a90bd3aeca1faa3ce87f5b2bf71b28a1eadf656d2d9066d6525b78735485e
Ursache des Fehlers ist: Kodierungsfehler
In Zeichen dekodiert | tr>
解码成字符 |
xmlDokument, wenn der Zeichensatz falsch ist
|
Auf Festplatte schreibenIn Binärcode kodiert00 11 |
Festplattendatei |
Eigenständig:Geben Sie an, ob das Dokument auf andere Ressourcen verweisen muss,Der Attributwert ist nur: ja oder nein
Ja: unabhängig Nein: nicht unabhängig
XML-Datei ist wie HTML-Datei eigentlich eine Textdatei.
Natürlich wird jeder sofort verstehen, dass das gebräuchlichste Tool zum Erstellen von XML-Dateien dasselbe wie HTML ist, nämlich „Notepad“.
Neben „Notepad“ gibt es natürlich noch einige weitere praktische Tools, wie XML Notepad, XML Pro und CLIP! XML-Editor usw.,
Ein Hauptmerkmal dieser Tools besteht darin, dass sie prüfen können, ob die von Ihnen erstellte XML-Datei der XML-Spezifikation entspricht. Allerdings sind diese Tools derzeit nur auf Englisch verfügbar und kostenpflichtig.
Natürlich können Sie weiterhin Tools wie FrontPage und DreamWeaver verwenden, diese sind jedoch nicht sehr komfortabel zu verwenden.
Angesichts der zunehmenden Beliebtheit von XML glaube ich, dass in naher Zukunft sehr nützliche Tools zum Erstellen von XML-Dateien auf den Markt kommen werden.
Jetzt erstellen wir mit „Notepad“ unsere XML-Datei. Schauen Sie sich zunächst eine XML-Datei an:
Beispiel 1
〈? xml version="1.0" binding="gb2312" ?〉
〈Referenzen〉
〈Bücher〉
〈Name〉Einführung in XML 〈/name〉
〈Autor〉Zhang San〈/Autor 〉
〈Preiswährungseinheit="RMB"〉20,00〈/Preis〉
〈/Buch〉
〈Buch〉
〈Name〉XML-Syntax〈/Name〉
〈!-- Dies Buch wird bald veröffentlicht--〉
〈Autor〉李思〈/Autor〉
〈Preis-Währungseinheit="RMB"〉18,00〈/Preis〉
〈/Buch〉
〈/Referenz Materialien 〉
Dies ist eine typische XML-Datei. Speichern Sie sie nach der Bearbeitung als Datei mit dem Suffix .xml. Wir können diese Datei in zwei Hauptteile unterteilen: die Dateipräambel (Prolog) und den Dateihauptteil.
Die erste Zeile in dieser Datei ist die Präambel der Datei. Diese Zeile muss eine XML-Datei deklarieren und muss sich auch in der ersten Zeile der XML-Datei befinden. Sie sagt dem XML-Parser hauptsächlich, wie er arbeiten soll.
Darunter gibt die Version die in dieser XML-Datei verwendete Standardversionsnummer an, die erforderlich ist; die Codierung gibt den in dieser XML-Datei verwendeten Zeichentyp an, der weggelassen werden kann Der Zeichencode muss ein Unicode-Zeichencode sein (es wird empfohlen, ihn nicht wegzulassen)
. Da wir in diesem Beispiel den GB2312-Zeichencode verwenden, kann die Codierungsanweisung nicht weggelassen werden. Es gibt auch einige Deklarationsanweisungen in der Präambel der Datei, die wir später vorstellen werden.
Der Rest der Datei gehört zum Dateikörper, in dem die Inhaltsinformationen der XML-Datei gespeichert sind.
Wir können sehen, dass der Hauptteil der Datei aus den ersten
Zunächst muss in der ersten Zeile der XML-Datei angegeben werden, dass es sich bei der Datei um eine XML-Datei handelt und welche XML-Spezifikationsversion sie verwendet. Vor der Datei dürfen keine anderen Elemente oder Kommentare stehen.
Zweitens kann es in einer XML-Datei nur ein Stammelement geben. In unserem ersten Beispiel ist 〈References〉... 〈/References〉 das Wurzelelement dieser XML-Datei.
Drittens müssen die Tags in der XML-Datei korrekt geschlossen werden, d. h. in der XML-Datei muss das Kontroll-Tag über ein entsprechendes schließendes Tag verfügen. Beispiel: Das
Viertens dürfen sich die Markierungen nicht kreuzen. In der vorherigen HTML-Datei könnten Sie so schreiben:
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉, 〈B〉 und 〈H〉 Es gibt überlappende Bereiche zwischen den
-Tags und In XML ist eine solche Verschachtelung von Tags strengstens verboten und Tags müssen in einer regelmäßigen Reihenfolge erscheinen.
Fünftens müssen Attributwerte in „“-Zeichen eingeschlossen werden. Zum Beispiel „1.0“, „gb2312“, „RMB“ im ersten Beispiel. Sie sind alle durch „ “ umschlossen und können nicht weggelassen werden.
Sechstens muss bei englischen Steuer-Tags, Anweisungen und Attributnamen die Groß-/Kleinschreibung beachtet werden. Anders als in HTML haben in HTML Tags wie und die gleiche Bedeutung, während in XML Tags wie
Siebtens , wir wissen, dass wir in HTML-Dateien, wenn wir möchten, dass der Browser die von uns eingegebenen Dinge intakt anzeigt, diese Dinge in 〈pre〉〈/pre〉 einfügen können oder 〈xmp〉〈/xmp〉 die Mitte markiert. Dies ist für die Erstellung von HTML-Unterrichtswebseiten für uns unerlässlich, da der HTML-Quellcode auf der Webseite angezeigt werden muss. Um eine solche Funktion in XML zu implementieren, müssen CDATA-Tags verwendet werden. Die Informationen im CDATA-Tag werden vom Parser intakt an die Anwendung übergeben und alle Steuertags im Informationssegment werden nicht analysiert. Der CDATA-Bereich ist durch „
Grundregeln für das XML-Element
Die Grundeinheit , XML Dokument ist bestehend aus Elementen, die Schicht für Schicht verschachtelt sind. Das gesamte xml-Dokument beginnt mit dem Stammelement , und das -Stammelement enthält mehrere Unterelemente , , und jedes Unterelement kann mehrere Unterelemente enthalten , Damit kann ein xml-Dokument erstellt werden.
Xml Tag-Syntax:
1, Die Tags von >
Doppelter Tag:eef539ada5268f07d66db9a8738851424c3171265b81d284ea760a3442547322
2, xml Tag-Anforderungen: 1, Tag-Namen können Buchstaben (
einschließlich nicht-westeuropäischer Zeichen) , Zahlen, Unterstriche (_), Unterstriche (- ), Doppelpunkt (:)
und Punkt(.) bilden , , dürfen aber nicht mit Zahlen, Bindestrichen und Punkten beginnen. 2, Tag-Name darf nicht 4294f0baa55400e8f84624371e905df2,,,$ und andere Symbole
3Versuchen Sie, keine englischen Doppelpunkte (:), in Etikettennamen zu verwenden, es sei denn, Sie verwenden einen Namespace. 4, Tag-Name darf nicht mit einer Kombination aus Groß- und Kleinbuchstaben beginnen, wie z. B. xml,
XML, usw. 5 Tag-Namen dürfen keine Leerzeichen enthalten.
6, bei Tag-Namen wird die Groß-/Kleinschreibung beachtet 3, xml markiert verschachtelte untergeordnete Elemente: xml ermöglicht eine tiefe Verschachtelung von untergeordneten Elementen, sofern eine angemessene Verschachtelung zwischen Elementen gewährleistet ist ist, . und das xml-Element können mehrere Unterelemente mit demselben Namen verschachteln, und diese mehreren Unterelemente werden geordnet. First:xml 5dea791f357af447b29416c1a732fdbe f4ae2f7f27c323e288ab71ffa9ba05bc 2e638c48a598626782af83ef1729758b 897e25a583b7cb6422150922045ae74582fbf1c33ae0a8d6cbd0d7d5aff17d138a1eadf656d2d9066d6525b78735485e xml: 9a31431220bdd2a7566587ceb13604db e76702e6c00bc247b86f5afa20a01c42 17572c0704de1f6918f46902d2b174c2681aa5f11636ff975d5b341a6c40e236
43417ef88fe37accfe6bed8720c4ca991132c240b33d0ce34537fe266a13bdae
🎜>/> ebc629422dbff163dcb368b00d2e3e65
5fb81cfb9a387024e010559c1469a16d
4, leeres Element: leeres Element kann keine untergeordneten Elemente akzeptieren,
kann auch nicht akzeptieren String-Inhalt.Das dritte xml
:Und kann akzeptieren mehrere Attribute
0f6fa65eb6c7f3ed4374d12bf4ac01bd463aef0d2da08708f472268a99530dbe 🎜>
0f6fa65eb6c7f3ed4374d12bf4ac01bd
Ein leeres Element akzeptiert beispielsweise Attribute:
06f9063201224c5ea2c737869b78b220
5、字符数据
463aef0d2da08708f472268a99530dbe
2c6008b0e56443c91d19286e6d5aeb74Struts2开发详解1d3f22abb3651fd0d3b978b732f443e5
2c6008b0e56443c91d19286e6d5aeb74
Struts2开发详解
1d3f22abb3651fd0d3b978b732f443e5
0f6fa65eb6c7f3ed4374d12bf4ac01bd
对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理
如果文本字符中包含了一些特殊的字符,例如9916825e1251ffb5610956d1d0de7076
ae0dad9014289c6d12010d8d7c16d4801+3e9fae4ba621339ac778d677fd6c1e93e
f0f56cc353d60613bb77ad77dc4a2b71
代表的是文本字符串中包含了特殊的字符
有以下两种方法解决:
1、 使用实体引用:用另一个特殊符号代替这些特殊符号
2、使用CDATA标记:将整个文档定义成字符串。
1、 使用实体引用
44268761adfa814cf615c226dea79439
a30d83af1c24e4dd3fb885081ed8bb3c
ae0dad9014289c6d12010d8d7c16d4801+3&6ccdf030973307f116f98ffdd41846a0
f0f56cc353d60613bb77ad77dc4a2b71
上面的红色的<产生了干扰
解决如下:
44268761adfa814cf615c226dea79439
a30d83af1c24e4dd3fb885081ed8bb3c
ae0dad9014289c6d12010d8d7c16d4801+3<6a7f9fe91d91e1c9e48986c28ae44ee0d
5aab0e47e68d8c0ebdf2a06da5794f6a
2, Verwenden Sie CDATA Tags
unter speziellen Tags CDATA, alle Sonderzeichen , sind sogar gültige Elemente, die als behandelt werden einfache Zeichenfolgen. Auch Entitätsverweise verlieren ihre Wirkung und werden zu direktem Text. Das Syntaxformat von
CDATA lautet wie folgt:
9612175df1ba27a492a6d76d8f07bb73
b1f8b2b3f05f84dda823a315f542d798
992e6703422863eed848a0bdcb7096b1
1 +3 & lt; 6 >
& lt;/
Ausdruck & gt ;
Hinweis: Da das xml-Dokument den CDATA-Tag-Inhalt überhaupt nicht analysiert, , daher kann jeder Inhalt in
CDATAplatziert werden, wobei der Inhalt niemals falsch ist. 1, Kommentare
XmlDas Dokument kann auch Zeichendaten zur Erklärung hinzufügen, Diese Interpretationszeichenfolgen werden vom xml-Parser nicht verarbeitet. Diese erläuternden Texte werden Notizen genannt. Die Dokumentationskommentare von Xml sind genau die gleichen wie die von html.
XmlDas Syntaxformat von Kommentaren ist wie folgt:
ccfcbf723b3e38ed08b08e95deb98afcXml Kommentare dürfen Elemente und Tags enthalten.
Hinweis:
1. Xml Kommentare können nicht im Tag-Text platziert werden.
2. Platzieren Sie das xml-Dokument nicht vor der xml
-Dokumentdeklarationxml Dokument Die Aussage steht immer in der ersten Zeile
3. Verwenden Sie in Kommentaren keine doppelten Unterstriche (--)
…..2. VerarbeitungshinweiseVerarbeitungshinweise, siehe als
PI(Verarbeitungsanweisung). Verarbeitungsanweisungen werden verwendet, um die Parsing-Engine anzuweisen, den XML-Dokumentinhalt zu analysieren.
Verarbeitungsanweisungen werden verwendet, um Anwendungen, die xml Dokumente verarbeiten, Informationen bereitzustellen und teilen dem Prozessor mit, wie das Dokument verarbeitet werden soll. Ein vollständiges xml Dokumentverarbeitungsprogramm , kann die xml Dokumentverarbeitungsanweisungen , lesen und die entsprechende Verarbeitung gemäß den Verarbeitungsanweisungen durchführen, oder übergeben Sie es an das nächste Programm.
XmlDas Format der Verarbeitungsanweisung ist wie folgt:
69dd50a451c0427f92cf79aba5d64b3d
3 >xml Eigenschaften von Attributen:
1, xmlDas Attribut des Elements muss einen Attributwert haben,
Der Attributwert muss in Anführungszeichen eingeschlossen werden.2. Dasselbe xml-Element darf nicht mehrere Attribute mit demselben Namen haben
3. Es gibt keine Reihenfolge zwischen den mehreren Attributen im Xml-Element.
Zum Beispiel hat dieses
Buch<book> <isbn>123456780</isbn> <book_name>Java讲义</book_name> <price>99</price> </book>selbst einen
isbn book_name-Preis
Xml
muss ein Root-Element haben.<book isbn=”” book_name=”” price=””/>
Xml
1. Es muss eine Wurzel vorhanden sein Element
(Es gibt und nur eines)
2. Das -Element muss vernünftig enden 3, Elemente müssen sinnvoll verschachtelt sein
4, Die Attribute von Elementen müssen Attributwerte haben
Solange die oben genannten Bedingungen nicht erfüllt sind, handelt es sich um ein schlecht formatiertes xml-Dokument
Solange Wenn die oben genannten Bedingungen erfüllt sind, handelt es sich um ein wohlgeformtes Dokumentxml-Dokument
, das dtd oder
schema ist ein gültigesxml-Dokument.
🎜>Der Wurzelknoten entspricht dem Wurzelknoten des DOM-Baums.
<book> <computer> <name>网上介绍</name> <author>redarmy</author> </computer> <computer> <name>网上介绍</name> <author>redarmy</author> </computer> </book> Buch |
Computer |
book |
Computer
|
………
|
Computer |
name
|
Autor |
Hinweis:
muss ein Root-Tag haben und das Root-Tag muss einzigartig seinDas Start-Tag und das End-Tag müssen paarweise verwendet werden
Die Tags können nicht austauschbar verwendet werden
Leere Tags können in der Form „0ae1fceec665adbec242eff25c2c2266
“
Das Tag geschrieben werden unterscheidet zwischen Groß- und Kleinschreibung