Maison >développement back-end >Tutoriel XML/RSS >Notes d'étude Crazy XML (2) -------------Exigences de format
Syntaxe de XML
• Un fichier XML est divisé en les parties suivantes :
– Document Déclaration
– Élément
– Attributs
– – Zone CDATA, caractères spéciaux
– Instructions de traitement (instruction de traitement)
Déclaration de Xml
La déclaration la plus simple est 307f197fa35495e5bd15705cfb261526
Encodage
attribut: Encodage des caractères s'il n'est pas spécifié, la valeur par défaut est UTF-8 encodage
Jeu de caractères commun Chinois simplifié :
GBKou GB2312
Chinois traditionnel : BIG5Caractères d'Europe occidentale
: ISO8859-1Encodage international universel
: Unicode UTF-8Cas de démonstration :
52b189f45abba88b2989c5c1f30b7a34
74762f8230df72992038d5f71fc36fa4292423756a31b68bfc4f50ab35b87f1f
La cause de l'erreur est : Erreur d'encodage
Décodé en caractères
tr>
解码成字符 |
xml document lorsque le jeu de caractères est incorrect
|
Écrire sur le disque durEncodé en code binaire00 11 |
Fichier disque |
Autonome :Spécifiez si le document doit référencer d'autres ressources,La valeur de l'attribut est uniquement : oui ou non
Oui : indépendantNon : non indépendant
Le fichier XML, comme le fichier HTML, est en fait un fichier texte.
Évidemment, tout le monde comprendra immédiatement que l'outil le plus courant pour créer des fichiers XML est le même que le HTML, à savoir le "Bloc-notes".
En plus de "Notepad", il existe bien sûr des outils plus pratiques, tels que XML Notepad, XML Pro et CLIP ! Éditeur XML, etc.,
Une caractéristique majeure de ces outils est qu'ils peuvent vérifier si le fichier XML que vous créez est conforme à la spécification XML. Cependant, ces outils ne sont actuellement disponibles qu’en anglais et sont payants.
Bien sûr, vous pouvez toujours utiliser des outils tels que FrontPage et DreamWeaver, mais ils ne sont pas très pratiques à utiliser.
Avec la popularité progressive du XML, je pense que des outils très utiles pour créer des fichiers XML apparaîtront dans un avenir proche.
Utilisons maintenant "Notepad" pour créer notre fichier XML. Regardez d'abord un fichier XML :
Exemple 1
〈 ? xml version="1.0" encoding="gb2312" ?〉
〈Références〉
〈Livres〉
〈Nom〉Introduction à XML 〈/nom〉
〈Auteur〉Zhang San〈/Auteur 〉
〈Unité monétaire du prix="RMB"〉20,00〈/Prix〉
〈/Livre〉
〈Livre〉
〈Nom〉Syntaxe XML〈/Nom〉
〈 !-- Ce le livre sera bientôt publié--〉
〈Auteur〉李思〈/Auteur〉
〈Price Currency Unit="RMB"〉18.00〈/Price〉
〈/Book〉
〈/Référence Matériaux 〉
Il s'agit d'un fichier XML typique Après l'édition, enregistrez-le sous forme de fichier avec le suffixe .xml. Nous pouvons diviser ce fichier en deux parties principales : le préambule du fichier (Prolog) et le corps du fichier.
La première ligne de ce fichier est le préambule du fichier. Cette ligne est quelque chose qu'un fichier XML doit déclarer, et elle doit également être située sur la première ligne du fichier XML. Elle indique principalement à l'analyseur XML comment fonctionner.
Parmi eux, la version indique le numéro de version standard utilisé dans ce fichier XML, qui est obligatoire ; l'encodage indique le type de caractère utilisé dans ce fichier XML, qui peut être omis. Lorsque vous omettez cette instruction, le suivant. le code de caractère doit être un code de caractère Unicode (il est recommandé de ne pas l'omettre)
. Étant donné que nous utilisons le code de caractères GB2312 dans cet exemple, l'instruction de codage ne peut pas être omise. Il y a également quelques déclarations dans le préambule du dossier, que nous présenterons plus tard.
Le reste du fichier appartient au corps du fichier, où les informations sur le contenu du fichier XML sont stockées.
Nous pouvons voir que le corps principal du fichier est composé des balises de contrôle de début
Tout d'abord, la première ligne du fichier XML doit déclarer que le fichier est un fichier XML et la version de la spécification XML qu'il utilise. Il ne peut y avoir d'autres éléments ou commentaires devant le fichier.
Deuxièmement, il ne peut y avoir qu'un seul élément racine dans un fichier XML. Dans notre premier exemple, 〈Références〉... 〈/Références〉 est l'élément racine de ce fichier XML.
Troisièmement, les balises du fichier XML doivent être fermées correctement, c'est-à-dire que dans le fichier XML, la balise de contrôle doit avoir une balise de fermeture correspondante. Par exemple : la balise
Quatrièmement, les marques ne doivent pas se croiser. Dans le fichier HTML précédent, vous pouviez écrire comme ceci :
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉, 〈B〉 et 〈H〉 Il y a des zones qui se chevauchent entre les balises
, et En XML, un tel entrelacement de balises est strictement interdit et les balises doivent apparaître dans un ordre régulier.
Cinquièmement, les valeurs d'attribut doivent être entourées de signes " ". Tels que "1.0", "gb2312", "RMB" dans le premier exemple. Ils sont tous entourés de symboles « » et ne peuvent être omis.
Sixièmement, les balises de contrôle, les instructions et les noms d'attributs en anglais doivent être sensibles à la casse. Différent du HTML, en HTML, les balises comme et ont la même signification, tandis qu'en XML, les balises comme
Septième , nous savons que dans les fichiers HTML, si nous voulons que le navigateur affiche intacts les éléments que nous avons saisis, nous pouvons mettre ces éléments dans 〈pre〉〈/pre〉 ou 〈xmp〉〈/xmp〉 marque le milieu. Ceci est essentiel pour nous de créer des pages Web pédagogiques HTML, car le code source du HTML doit être affiché dans la page Web. En XML, pour réaliser une telle fonction, des balises CDATA doivent être utilisées. Les informations contenues dans la balise CDATA sont transmises intactes à l'application par l'analyseur, et les balises de contrôle du segment d'informations ne sont pas analysées. La zone CDATA est marquée par "
Règles de base pour l'élément Xml
L'unité de base , xml est composé d'éléments imbriqués couche par couche. L'ensemble du document xml commence à partir de l'élément racine , et l'élément racine contient plusieurs sous-éléments , , et chaque sous-élément peut contenir plusieurs sous-éléments , Ainsi, un document xml peut être formé.
Xml syntaxe des balises :
1, Les tags de >
Tag double :89298112391fbe3418f93a024f9d5d45f5b112ea0c27cab6aac12bc27c406d86
2, xml exigences relatives aux balises : 1, les noms de balises peuvent avoir des lettres (
y compris des caractères non européens) , des chiffres, des traits de soulignement (_), des traits de soulignement (- ), deux points (:)
et point(.) forment , mais ne peut pas commencer par des chiffres, des tirets et des points. 2, le nom de la balise ne peut pas contenir 4294f0baa55400e8f84624371e905df2,,,$ et d'autres symboles
3. Essayez de ne pas avoir de deux-points anglais (:), dans les noms d'étiquettes, sauf si vous utilisez un espace de noms. 4, le nom de la balise ne peut pas commencer par une combinaison de caractères majuscules et minuscules tels que xml
,XML , etc. 5
. Les noms de balises ne peuvent pas contenir d'espaces.6, les noms de balises sont sensibles à la casse 3, xml balise les éléments enfants imbriqués : xml permet une imbrication profonde des éléments enfants, à condition qu'une imbrication raisonnable entre les éléments soit assurée. est, . et l'élément xml peuvent imbriquer plusieurs sous-éléments portant le même nom , et ces sous-éléments sont ordonnés. Premier:xml 677dae408eeb73fe55e21497c6c208ad 2f32f26d4519a68535f339121e86c6d7 2e638c48a598626782af83ef1729758b 897e25a583b7cb6422150922045ae745c4a6455a04fe00e7955e99f6636d8e30292423756a31b68bfc4f50ab35b87f1f xml: 2cd924d56e54c1948ef5c31b98c98b58 b57a1efaec61dacd1f9c8c065ca10be5 17572c0704de1f6918f46902d2b174c2681aa5f11636ff975d5b341a6c40e236
43417ef88fe37accfe6bed8720c4ca991132c240b33d0ce34537fe266a13bdae
🎜>/>d821da6bd49bb5cd6fd35b6348f9f5f7
4, élément vide : l'élément vide ne peut pas accepter les éléments enfants, ne peut pas non plus accepter contenu de la chaîne.
Le troisième xml :
>Et peut accepter plusieurs attributs 0f6fa65eb6c7f3ed4374d12bf4ac01bd
463aef0d2da08708f472268a99530dbe 🎜>
0f6fa65eb6c7f3ed4374d12bf4ac01bdPar exemple, un élément vide accepte les attributs :
06f9063201224c5ea2c737869b78b220
5、字符数据
463aef0d2da08708f472268a99530dbe
2c6008b0e56443c91d19286e6d5aeb74Struts2开发详解1d3f22abb3651fd0d3b978b732f443e5
2c6008b0e56443c91d19286e6d5aeb74
Struts2开发详解
1d3f22abb3651fd0d3b978b732f443e5
0f6fa65eb6c7f3ed4374d12bf4ac01bd
对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理
如果文本字符中包含了一些特殊的字符,例如9916825e1251ffb5610956d1d0de7076
ae0dad9014289c6d12010d8d7c16d4801+3e9fae4ba621339ac778d677fd6c1e93e
f0f56cc353d60613bb77ad77dc4a2b71
代表的是文本字符串中包含了特殊的字符
有以下两种方法解决:
1、 使用实体引用:用另一个特殊符号代替这些特殊符号
2、使用CDATA标记:将整个文档定义成字符串。
1、 使用实体引用
44268761adfa814cf615c226dea79439
a30d83af1c24e4dd3fb885081ed8bb3c
ae0dad9014289c6d12010d8d7c16d4801+3&6ccdf030973307f116f98ffdd41846a0
f0f56cc353d60613bb77ad77dc4a2b71
上面的红色的<产生了干扰
解决如下:
44268761adfa814cf615c226dea79439
a30d83af1c24e4dd3fb885081ed8bb3c
ae0dad9014289c6d12010d8d7c16d4801+3<6a7f9fe91d91e1c9e48986c28ae44ee0d
04fad4aef7048d93017d7a8ce8997efa
2, Utiliser CDATA balises
sous les balises spéciales CDATA, tous les caractères spéciaux , sont même des éléments valides seront traités comme des cordes simples. Les références d'entité perdent également leur effet et deviennent du texte direct. Le format de syntaxe de
CDATA est le suivant :
69b998e84133c7ed2fd22bc9ead57fd2
dd705bd02b96733e49696a5e86557961
40c68da7014b91ad23a45722c282eea6
1 303804cd15bce8afb1df26f358acd7ede
Remarques : Puisque le document xml n'effectuera aucune analyse sur le contenu du CDATA tag ,
, donc tout contenu peut être placé dansCDATA, où le contenu n'est jamais faux. 1,
CommentairesXmlLe document peut également ajouter des données de caractères pour explication, Ces chaînes d'interprétation ne seront pas traitées par l'analyseur xml. Ces textes explicatifs sont appelés notes. Les commentaires de documentation de Xml sont exactement les mêmes que ceux de html
.String
-->Xml les commentaires peuvent contenir éléments et balises. Remarque :
1. Les commentaires Xml ne peuvent pas être placés dans le corps de la balise.
2. Ne pas mettre le document xml avant la déclaration du document
xmlxml document La déclaration est toujours sur la première ligne
3 N'utilisez pas de doubles traits de soulignement dans les commentaires
(--)<.>…..
2. Instructions de traitementInstructions de traitement, visées. comme PI (instruction de traitement). Les instructions de traitement sont utilisées pour indiquer au moteur d'analyse comment analyser le contenu du document XML
.Les instructions de traitement sont utilisées pour fournir des informations aux applications qui traitent les documents xml indiquent au processeur comment traiter le document. Un programme complet de traitement de documents xml , peut lire les instructions de traitement de documents xml , et effectuer le traitement correspondant conformément aux instructions de traitement, ou passez-le au programme suivant. XmlLe format de l'instruction de traitement est le suivant : 672292ef743afb63237201bd00ce2d73 Attributs xmlCaractéristiques des attributs : 1. 2. Le même élément ne peut pas avoir plusieurs attributs portant le même nom 3. Il n'y a pas d'ordre parmi les multiples attributs dans l'élément . Par exemple, ce livre puis Xml doit avoir un élément racine. XmlLa structure globale du document 1 Il doit y avoir une racine. element( )2 L'élément doit se terminer raisonnablement 3, Les éléments doivent être raisonnablement imbriqués 4, Les attributs des éléments doivent avoir des valeurs d'attribut Tant que les conditions ci-dessus ne sont pas remplies, il s'agit d'un document xml mal formaté Tant que les conditions ci-dessus sont remplies, il s'agit d'un documentxml bien formé et conforme au dtd ou au schéma est un document valide. 🎜>Le nœud racine correspond au nœud racine de l'arborescence DOM. livre<book>
<isbn>123456780</isbn>
<book_name>Java讲义</book_name>
<price>99</price>
</book>
lui-même a un <book isbn=”” book_name=”” price=””/>
<book>
<computer>
<name>网上介绍</name>
<author>redarmy</author>
</computer>
<computer>
<name>网上介绍</name>
<author>redarmy</author>
</computer>
</book>
ordinateur |
computer |
ordinateur
|
|
ordinateur |
nom
|
auteur |
Remarque :
doit avoir une balise racine et la balise racine doit être uniqueLa balise de début et la balise de fin doivent être utilisées par paires
Les balises ne peuvent pas être utilisées de manière interchangeable
Les balises vides peuvent être écrites sous la forme de "6fe4daffa72a757c66718cc0828d65ac
"
La balise est sensible à la casse