Maison > Article > développement back-end > Bases de XML : structure et syntaxe
[Introduction] Utilisons maintenant le Bloc-notes pour créer notre fichier XML. Regardons d'abord un fichier XML : 名〉 Utilisez "Notepad" pour créer notre fichier XML. Regardez d'abord un fichier XML :
Exemple 1
〈?xml version="1.0" encoding="gb2312" ?〉 〈参考资料〉 〈书籍〉 〈名称〉XML入门精解〈/名称〉 〈作者〉张三〈/作者〉 〈价格 货币单位="人民币"〉20.00〈/价格〉 〈/书籍〉 〈书籍〉 〈名称〉XML语法〈/名称〉 〈!--此书即将出版--〉 〈作者〉李四〈/作者〉 〈价格 货币单位="人民币"〉18.00〈/价格〉 〈/书籍〉 〈/参考资料〉
Il s'agit d'un fichier XML typique Après l'édition, enregistrez-le sous forme de fichier avec le suffixe .xml. Nous pouvons diviser ce fichier en deux parties principales : le préambule du fichier (PRolog) et le corps du fichier. La première ligne de ce fichier est le préambule du fichier. Cette ligne est quelque chose qu'un fichier XML doit déclarer, et elle doit également être située sur la première ligne du fichier XML. Elle indique principalement à l'analyseur XML comment fonctionner. Parmi eux, la version est le numéro de version standard utilisé par ce fichier XML, qui est obligatoire ; le codage spécifie le type de caractère utilisé dans ce fichier XML, qui peut être omis. Lorsque vous omettez cette instruction, le code de caractère suivant doit être un code de caractère Unicode. (il est recommandé de ne pas l'omettre). Étant donné que nous utilisons le code de caractères GB2312 dans cet exemple, l'instruction de codage ne peut pas être omise. Il y a également quelques déclarations dans le préambule du dossier, que nous présenterons plus tard.
Le reste du fichier appartient au corps du fichier et les informations sur le contenu du fichier XML sont stockées ici. Nous pouvons voir que le corps principal du fichier est composé des balises de contrôle de début
〈!--Ce livre sera bientôt publié--〉Cette phrase est la même que le HTML, c'est un commentaire Dans le fichier XML, la partie commentaire est placée entre les "〈!--" et les balises "--〉" entre les parties.
Comme vous pouvez le constater, les fichiers XML sont assez simples. Comme HTML, les fichiers XML sont également composés d'une série de balises. Cependant, les balises des fichiers XML sont nos propres balises personnalisées et ont des significations claires. Nous pouvons expliquer la signification du contenu des balises.
Après avoir eu une première impression des fichiers XML, parlons en détail de la syntaxe des fichiers XML. Avant de parler de grammaire, nous devons comprendre un concept important, qui est XML Parse.
1. Analyseur XML
La fonction principale de l'analyseur est de vérifier s'il y a des erreurs structurelles dans le fichier XML, de supprimer les balises dans le fichier XML et de lire le contenu correct pour passez à l’étape suivante. Traitement de la demande en une seule étape. XML est un langage de balisage utilisé pour structurer les informations sur les fichiers. La spécification XML contient des règles détaillées sur la façon de marquer la structure des fichiers. L'analyseur est un logiciel écrit selon ces règles (principalement écrit en Java). Tout comme le HTML, dans le navigateur, il doit y avoir un analyseur HTML pour que le navigateur puisse « lire » diverses pages Web composées de balises HTML et les afficher devant nous. S'il existe des balises que l'analyseur HTML du navigateur ne peut pas lire, un message d'erreur nous sera renvoyé.
Étant donné que les balises HTML actuelles sont en fait assez déroutantes et qu'il existe de nombreuses balises non standard (certaines pages Web peuvent être affichées normalement avec IE, mais pas avec Netscape Navigator), donc dès le début, les concepteurs de XML La syntaxe et la structure de XML sont strictement stipulées. Les fichiers XML que nous écrivons doivent être conformes à ces réglementations, sinon l'analyseur XML vous montrera sans pitié des messages d'erreur.
Il existe deux types de fichiers XML, l'un est le fichier XML bien formé et l'autre est le fichier XML de validation.
Si un fichier XML satisfait à certaines règles pertinentes de la spécification XML et n'utilise pas de DTD (définition du format de document - détails plus tard), il peut être appelé Well-Formed. Et si un fichier XML est bien formé, que la DTD est utilisée correctement et que la syntaxe de la DTD est correcte, alors le fichier est en cours de validation. Correspondant aux deux fichiers XML, il existe deux analyseurs XML, l'un est l'analyseur Well-Formed et l'autre est l'analyseur Validating. IE 5 inclut un analyseur de validation, qui peut également être utilisé pour analyser des fichiers XML bien formés.
Vérifiez s'il répond aux conditions de bien formé. Nous pouvons ouvrir le premier fichier XML que nous venons de modifier avec un navigateur IE 5 ou supérieur.
Vous voudrez peut-être demander pourquoi l'affichage dans le navigateur est le même que celui de mon fichier source ? C'est vrai, car pour les fichiers XML, on ne connaît que le contenu, et sa forme d'affichage est complétée par CSS ou XSL. Ici, nous n'avons pas défini son fichier CSS ou XSL pour ce fichier XML, il est donc affiché sous sa forme originale. En fait, pour l'échange électronique de données, seul un fichier XML est nécessaire. Si nous voulons l'afficher sous une forme quelconque, nous devons éditer le fichier CSS ou XSL (cette question sera abordée plus tard).
2. Fichier XML bien formé
Nous savons que le XML doit être bien formé pour être correctement analysé par l'analyseur et affiché dans le navigateur. Alors, qu’est-ce qu’un fichier XML bien formé ? Il existe principalement les directives suivantes, qui doivent être respectées lorsque nous créons des fichiers XML.
Tout d'abord, la première ligne du fichier XML doit déclarer que le fichier est un fichier XML et la version de spécification XML qu'il utilise. Il ne peut y avoir d'autres éléments ou commentaires devant le fichier.
Deuxièmement, il ne peut y avoir qu'un seul élément racine dans un fichier XML. Dans notre premier exemple, 〈Références〉... 〈/Références〉 est l'élément racine de ce fichier XML.
Troisièmement, les balises du fichier XML doivent être fermées correctement, c'est-à-dire que dans le fichier XML, la balise de contrôle doit avoir une balise de fermeture correspondante. Par exemple : la balise
Quatrièmement, les marques ne doivent pas se croiser. Dans le fichier HTML précédent, vous pouvez écrire comme ceci :
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉 et 〈H〉
Il y a des chevauchements zones, mais en XML, il est strictement interdit d'écrire de telles balises entrelacées, et les balises doivent apparaître dans un ordre régulier.
Cinquièmement, les valeurs d'attribut doivent être entourées de signes " ". Tels que "1.0", "gb2312", "RMB" dans le premier exemple. Ils sont tous entourés de " " et ne peuvent être manqués.
Sixièmement, les balises de contrôle, les instructions et les noms d'attributs en anglais doivent être sensibles à la casse. Contrairement au HTML, en HTML, les balises comme et ont la même signification, tandis qu'en XML, les balises comme
Septièmement, nous savons que dans les fichiers HTML, si nous voulons que le navigateur affiche intacts les éléments que nous saisissons, nous pouvons mettre ces éléments dans les marques 〈pre〉〈/pre〉 ou 〈 xmp〉〈/xmp〉. le milieu. Ceci est essentiel pour nous de créer des pages Web pédagogiques HTML, car le code source du HTML doit être affiché dans la page Web. En XML, pour réaliser une telle fonction, des balises CDATA doivent être utilisées. Les informations contenues dans la balise CDATA sont transmises intactes à l'application par l'analyseur, et les balises de contrôle du segment d'informations ne sont pas analysées. La zone CDATA est marquée par "
Exemple 2
〈![CDATA[flying xml〉〉〉〉〉,:-)
oooo〈〈〈〈〈〈〈
>〉
Huitièmement, XML gère les caractères d'espacement différemment du HTML. La norme HTML stipule que quel que soit le nombre de blancs, ils seront traités comme un seul blanc ; tandis qu'en XML, il est stipulé que l'analyseur doit remettre fidèlement tous les blancs autres que les balises aux applications en aval pour traitement. De cette façon, nous devons parfois abandonner l'habitude de l'indentation lors de l'écriture de fichiers HTML, car l'analyseur doit également traiter les espaces indentés. Par exemple :
〈Auteur〉Zhang San〈/Auteur〉
et
〈Auteur〉
Zhang San
〈/Auteur>
Le contenu ci-dessus est car l'analyseur est différent (ce dernier inclut en plus du caractère Zhang San dans la balise
Si nous voulons indiquer clairement au programme XML que les espaces dans les balises ont des significations claires et ne doivent pas être supprimés par hasard (par exemple, dans certains poèmes, les espaces ont des significations spécifiques), nous pouvons ajouter une balise XML aux balises Attribut intégré - xml:space. Par exemple (notez la casse des noms et valeurs d'attribut) :
Poésie xml:space="preserver"">
Patrie ! patrie!
Ma patrie !
〈/Poème>
De plus, dans le fichier XML, si les caractères spéciaux du tableau 1 doivent être utilisés, ils doivent être remplacés par les symboles correspondants.
Tableau 1
Symboles de substitution de caractères spéciaux
&& &
>
Permettez-moi de faire un résumé ici : le fichier XML qui répond aux exigences ci-dessus est le fichier Well-Formed Fichier XML. Il s’agit de la condition la plus élémentaire pour écrire des fichiers XML. Vous pouvez constater que la syntaxe des fichiers XML est beaucoup plus stricte que celle du HTML. En raison de réglementations aussi strictes, il est beaucoup plus facile pour les ingénieurs logiciels d'écrire des analyseurs XML. Contrairement à l'écriture d'analyseurs pour le langage HTML, ils doivent travailler dur pour s'adapter aux différentes méthodes d'écriture de pages Web et améliorer l'adaptabilité de leurs propres navigateurs. En fait, c’est aussi une bonne chose pour nous, débutants. Faites simplement ce que vous voulez et n'avez pas à vous soucier de la façon d'écrire divers HTML comme avant.
On voit que dans les fichiers XML, la plupart des balises personnalisées sont utilisées. Mais réfléchissez-y, si deux entreprises A et B du même secteur souhaitent échanger des données à l'aide de fichiers XML, l'entreprise A utilise la balise
Si un fichier XML est bien formé et qu'il est correctement créé sur la base d'une DTD, alors le fichier XML s'appelle : Validation du fichier XML. L'analyseur correspondant s'appelle : Validating Parser.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!