Maison >développement back-end >Tutoriel XML/RSS >Notes d'étude Crazy XML (2) -------------Exigences de format

Notes d'étude Crazy XML (2) -------------Exigences de format

黄舟
黄舟original
2017-02-21 14:04:181566parcourir

Syntaxe de XML

 Un fichier XML est divisé en les parties suivantes :

 Document Déclaration

Élément

Attributs

 Zone CDATA, caractères spéciaux

 Instructions de traitement (instruction de traitement)

Déclaration de Xml

La déclaration la plus simple est 307f197fa35495e5bd15705cfb261526

Encodage

attribut

 : Encodage des caractères s'il n'est pas spécifié, la valeur par défaut est UTF-8 encodage

Jeu de caractères commun Chinois simplifié :

GBK

ou GB2312

Chinois traditionnel  : BIG5Caractères d'Europe occidentale

 : ISO8859-1

Encodage international universel

 : Unicode UTF-8

Cas de démonstration :

52b189f45abba88b2989c5c1f30b7a34

74762f8230df72992038d5f71fc36fa4292423756a31b68bfc4f50ab35b87f1f

La cause de l'erreur est : Erreur d'encodage


Décodé en caractères

tr>


解码成字符

xml document lorsque le jeu de caractères est incorrect




新建是一个.txt文档

保存的是.xml UTF-8

默认的编码ANSI

中国


写入到硬盘

编码成二进制码

00 11

Le nouveau est un document


磁盘文件

.txtCelui enregistré est .xml UTF-8 Encodage par défautANSI Chine
Écrire sur le disque durEncodé en code binaire00 11
Fichier disque

Autonome :Spécifiez si le document doit référencer d'autres ressources,La valeur de l'attribut est uniquement : oui ou non

Oui : indépendantNon : non indépendant

Le fichier XML, comme le fichier HTML, est en fait un fichier texte.

Évidemment, tout le monde comprendra immédiatement que l'outil le plus courant pour créer des fichiers XML est le même que le HTML, à savoir le "Bloc-notes".

En plus de "Notepad", il existe bien sûr des outils plus pratiques, tels que XML Notepad, XML Pro et CLIP ! Éditeur XML, etc.,

Une caractéristique majeure de ces outils est qu'ils peuvent vérifier si le fichier XML que vous créez est conforme à la spécification XML. Cependant, ces outils ne sont actuellement disponibles qu’en anglais et sont payants.

Bien sûr, vous pouvez toujours utiliser des outils tels que FrontPage et DreamWeaver, mais ils ne sont pas très pratiques à utiliser.

Avec la popularité progressive du XML, je pense que des outils très utiles pour créer des fichiers XML apparaîtront dans un avenir proche.
Utilisons maintenant "Notepad" pour créer notre fichier XML. Regardez d'abord un fichier XML :


Exemple 1


〈 ? xml version="1.0" encoding="gb2312" ?〉
〈Références〉
〈Livres〉
〈Nom〉Introduction à XML 〈/nom〉
〈Auteur〉Zhang San〈/Auteur 〉
〈Unité monétaire du prix="RMB"〉20,00〈/Prix〉
〈/Livre〉
〈Livre〉
〈Nom〉Syntaxe XML〈/Nom〉
〈 !-- Ce le livre sera bientôt publié--〉
〈Auteur〉李思〈/Auteur〉
〈Price Currency Unit="RMB"〉18.00〈/Price〉
〈/Book〉
〈/Référence Matériaux 〉


Il s'agit d'un fichier XML typique Après l'édition, enregistrez-le sous forme de fichier avec le suffixe .xml. Nous pouvons diviser ce fichier en deux parties principales : le préambule du fichier (Prolog) et le corps du fichier.

La première ligne de ce fichier est le préambule du fichier. Cette ligne est quelque chose qu'un fichier XML doit déclarer, et elle doit également être située sur la première ligne du fichier XML. Elle indique principalement à l'analyseur XML comment fonctionner.

Parmi eux, la version indique le numéro de version standard utilisé dans ce fichier XML, qui est obligatoire ; l'encodage indique le type de caractère utilisé dans ce fichier XML, qui peut être omis. Lorsque vous omettez cette instruction, le suivant. le code de caractère doit être un code de caractère Unicode (il est recommandé de ne pas l'omettre)

. Étant donné que nous utilisons le code de caractères GB2312 dans cet exemple, l'instruction de codage ne peut pas être omise. Il y a également quelques déclarations dans le préambule du dossier, que nous présenterons plus tard.


Le reste du fichier appartient au corps du fichier, où les informations sur le contenu du fichier XML sont stockées.

Nous pouvons voir que le corps principal du fichier est composé des balises de contrôle de début et de fin . C'est ce qu'on appelle « l'élément racine » du fichier XML ; est utilisé comme direct Il appartient aux « éléments enfants » sous l'élément racine ; sous il y a des sous-éléments tels que , et . L'unité monétaire est un « attribut » dans l'élément et « RMB » est la « valeur de l'attribut ».


Tout d'abord, la première ligne du fichier XML doit déclarer que le fichier est un fichier XML et la version de la spécification XML qu'il utilise. Il ne peut y avoir d'autres éléments ou commentaires devant le fichier.


Deuxièmement, il ne peut y avoir qu'un seul élément racine dans un fichier XML. Dans notre premier exemple, 〈Références〉... 〈/Références〉 est l'élément racine de ce fichier XML.


Troisièmement, les balises du fichier XML doivent être fermées correctement, c'est-à-dire que dans le fichier XML, la balise de contrôle doit avoir une balise de fermeture correspondante. Par exemple : la balise doit avoir une balise de fermeture correspondante. Contrairement au HTML, la balise de fermeture de certaines balises est facultative. Si vous rencontrez une balise d'unité autonome dans un fichier XML, qui est similaire à Notes d'étude Crazy XML (2) -------------Exigences de format en HTML et n'a pas de balise de fin, XML l'appelle élément "vide". " doit être écrit comme ceci : 〈nom d'élément vide/〉. Si l'élément contient des attributs, il doit être écrit comme ceci : 〈nom d'élément vide nom d'attribut="valeur d'attribut"/〉.


Quatrièmement, les marques ne doivent pas se croiser. Dans le fichier HTML précédent, vous pouviez écrire comme ceci :
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉, 〈B〉 et 〈H〉 Il y a des zones qui se chevauchent entre les balises
, et En XML, un tel entrelacement de balises est strictement interdit et les balises doivent apparaître dans un ordre régulier.


Cinquièmement, les valeurs d'attribut doivent être entourées de signes " ". Tels que "1.0", "gb2312", "RMB" dans le premier exemple. Ils sont tous entourés de symboles « » et ne peuvent être omis.


Sixièmement, les balises de contrôle, les instructions et les noms d'attributs en anglais doivent être sensibles à la casse. Différent du HTML, en HTML, les balises comme et ont la même signification, tandis qu'en XML, les balises comme , ou sont différentes


Septième , nous savons que dans les fichiers HTML, si nous voulons que le navigateur affiche intacts les éléments que nous avons saisis, nous pouvons mettre ces éléments dans 〈pre〉〈/pre〉 ou 〈xmp〉〈/xmp〉 marque le milieu. Ceci est essentiel pour nous de créer des pages Web pédagogiques HTML, car le code source du HTML doit être affiché dans la page Web. En XML, pour réaliser une telle fonction, des balises CDATA doivent être utilisées. Les informations contenues dans la balise CDATA sont transmises intactes à l'application par l'analyseur, et les balises de contrôle du segment d'informations ne sont pas analysées. La zone CDATA est marquée par "


Règles de base pour l'élément Xml

L'unité de base , xml est composé d'éléments imbriqués couche par couche. L'ensemble du document xml commence à partir de l'élément racine , et l'élément racine contient plusieurs sous-éléments , , et chaque sous-élément peut contenir plusieurs sous-éléments , Ainsi, un document xml peut être formé.

Xml syntaxe des balises :

1

, Les tags de >

Tag double :

89298112391fbe3418f93a024f9d5d45f5b112ea0c27cab6aac12bc27c406d86

2, xml exigences relatives aux balises : 1, les noms de balises peuvent avoir des lettres (

y compris des caractères non européens

) , des chiffres, des traits de soulignement (_), des traits de soulignement (- ), deux points (:)

et point

(.) forment , mais ne peut pas commencer par des chiffres, des tirets et des points. 2, le nom de la balise ne peut pas contenir 4294f0baa55400e8f84624371e905df2,,,$ et d'autres symboles

3. Essayez de ne pas avoir de deux-points anglais (:), dans les noms d'étiquettes, sauf si vous utilisez un espace de noms. 4, le nom de la balise ne peut pas commencer par une combinaison de caractères majuscules et minuscules tels que xml

,

XML , etc. 5

. Les noms de balises ne peuvent pas contenir d'espaces.

6, les noms de balises sont sensibles à la casse

3, xml balise les éléments enfants imbriqués : xml permet une imbrication profonde des éléments enfants, à condition qu'une imbrication raisonnable entre les éléments soit assurée. est, . et l'élément xml peuvent imbriquer plusieurs sous-éléments portant le même nom , et ces sous-éléments sont ordonnés.

Premier:xml

677dae408eeb73fe55e21497c6c208ad

2f32f26d4519a68535f339121e86c6d7

2e638c48a598626782af83ef1729758b

897e25a583b7cb6422150922045ae745c4a6455a04fe00e7955e99f6636d8e30292423756a31b68bfc4f50ab35b87f1f

Deuxième

xml: 2cd924d56e54c1948ef5c31b98c98b58 b57a1efaec61dacd1f9c8c065ca10be5  17572c0704de1f6918f46902d2b174c2681aa5f11636ff975d5b341a6c40e236

43417ef88fe37accfe6bed8720c4ca991132c240b33d0ce34537fe266a13bdae

🎜>/>d821da6bd49bb5cd6fd35b6348f9f5f7

4, élément vide : l'élément vide ne peut pas accepter les éléments enfants, ne peut pas non plus accepter contenu de la chaîne.

Le troisième xml :

>

                                                                                                                                                    Et peut accepter plusieurs attributs 0f6fa65eb6c7f3ed4374d12bf4ac01bd

463aef0d2da08708f472268a99530dbe                                                                                                                                         🎜>

  0f6fa65eb6c7f3ed4374d12bf4ac01bdPar exemple, un élément vide accepte les attributs :

  06f9063201224c5ea2c737869b78b220

5、字符数据

   463aef0d2da08708f472268a99530dbe

      2c6008b0e56443c91d19286e6d5aeb74Struts2开发详解1d3f22abb3651fd0d3b978b732f443e5

      2c6008b0e56443c91d19286e6d5aeb74

         Struts2开发详解

      1d3f22abb3651fd0d3b978b732f443e5

   0f6fa65eb6c7f3ed4374d12bf4ac01bd

  对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理

 如果文本字符中包含了一些特殊的字符,例如9916825e1251ffb5610956d1d0de7076

 

        ae0dad9014289c6d12010d8d7c16d4801+3e9fae4ba621339ac778d677fd6c1e93e

   f0f56cc353d60613bb77ad77dc4a2b71

代表的是文本字符串中包含了特殊的字符

 

有以下两种方法解决:

1、 使用实体引用:用另一个特殊符号代替这些特殊符号

2、使用CDATA标记:将整个文档定义成字符串。

1、  使用实体引用

        44268761adfa814cf615c226dea79439

  a30d83af1c24e4dd3fb885081ed8bb3c

        ae0dad9014289c6d12010d8d7c16d4801+3&6ccdf030973307f116f98ffdd41846a0

  f0f56cc353d60613bb77ad77dc4a2b71

上面的红色的<产生了干扰

解决如下:

 44268761adfa814cf615c226dea79439

  a30d83af1c24e4dd3fb885081ed8bb3c

        ae0dad9014289c6d12010d8d7c16d4801+3<6a7f9fe91d91e1c9e48986c28ae44ee0d

04fad4aef7048d93017d7a8ce8997efa

2, Utiliser CDATA balises

sous les balises spéciales CDATA, tous les caractères spéciaux , sont même des éléments valides seront traités comme des cordes simples. Les références d'entité perdent également leur effet et deviennent du texte direct. Le format de syntaxe de

CDATA est le suivant :

69b998e84133c7ed2fd22bc9ead57fd2

dd705bd02b96733e49696a5e86557961

40c68da7014b91ad23a45722c282eea6

                                                                                 1 303804cd15bce8afb1df26f358acd7ede

Remarques : Puisque le document xml n'effectuera aucune analyse sur le contenu du CDATA tag ,

, donc tout contenu peut être placé dans

CDATA, où le contenu n'est jamais faux. 1,

Commentaires

XmlLe document peut également ajouter des données de caractères pour explication, Ces chaînes d'interprétation ne seront pas traitées par l'analyseur xml. Ces textes explicatifs sont appelés notes. Les commentaires de documentation de Xml sont exactement les mêmes que ceux de html

.

String

-->

Xml les commentaires peuvent contenir éléments et balises. Remarque :

1. Les commentaires Xml ne peuvent pas être placés dans le corps de la balise.

2. Ne pas mettre le document xml avant la déclaration du document

xml

xml document La déclaration est toujours sur la première ligne

3 N'utilisez pas de doubles traits de soulignement dans les commentaires

(--)

<.>…..

2. Instructions de traitementInstructions de traitement, visées. comme PI instruction de traitement). Les instructions de traitement sont utilisées pour indiquer au moteur d'analyse comment analyser le contenu du document XML

.

Les

instructions de traitement sont utilisées pour fournir des informations aux applications qui traitent les documents xml indiquent au processeur comment traiter le document. Un programme complet de traitement de documents xml , peut lire les instructions de traitement de documents xml , et effectuer le traitement correspondant conformément aux instructions de traitement, ou passez-le au programme suivant.

XmlLe format de l'instruction de traitement est le suivant :

672292ef743afb63237201bd00ce2d73

Attributs

xmlCaractéristiques des attributs :

1. 2. Le même élément

xml

ne peut pas avoir plusieurs attributs portant le même nom 3. Il n'y a pas d'ordre parmi les multiples attributs dans l'élément

Xml

.

<book>
     <isbn>123456780</isbn>
     <book_name>Java讲义</book_name>
      <price>99</price>
</book>

Par exemple, ce livre
lui-même a un

prix isbn book_name

puis

<book isbn=”” book_name=”” price=””/>

Xml doit avoir un élément racine.

XmlLa structure globale du document

1 Il doit y avoir une racine. element(

Il y en a et un seul

)2 L'élément doit se terminer raisonnablement

3, Les éléments doivent être raisonnablement imbriqués

4, Les attributs des éléments doivent avoir des valeurs d'attribut

Tant que les conditions ci-dessus ne sont pas remplies, il s'agit d'un document xml mal formaté

Tant que les conditions ci-dessus sont remplies, il s'agit d'un documentxml bien formé

et conforme au dtd ou au schéma est un document

xml

valide. 🎜>Le nœud racine correspond au nœud racine de l'arborescence DOM.

<book>
    <computer>
       <name>网上介绍</name>
       <author>redarmy</author>
    </computer>
    <computer>
        <name>网上介绍</name>
       <author>redarmy</author>
    </computer>
</book>


livre



book

ordinateur


computer


computer

ordinateur


………


computer

………
ordinateur


name

nom


author

auteur

Remarque :

doit avoir une balise racine et la balise racine doit être uniqueLa balise de début et la balise de fin doivent être utilisées par paires

Les balises ne peuvent pas être utilisées de manière interchangeable

Les balises vides peuvent être écrites sous la forme de "6fe4daffa72a757c66718cc0828d65ac

"


La balise est sensible à la casse

Ce qui précède est le contenu des folles notes d'étude XML (2)------------ - exigences de format Pour plus de contenu connexe, veuillez faire attention au site Web PHP chinois (www .php.cn) !
Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn