Maison  >  Article  >  développement back-end  >  Expliquer les espaces en XML

Expliquer les espaces en XML

怪我咯
怪我咯original
2017-04-05 17:09:411867parcourir

Pour les fichiers HTML, les espaces ne sont pas importants ; cependant, pour XML, la position par défaut est de conserver les nœuds spatiaux (voir ci-dessous pour une explication des nœuds spatiaux).


Selon la spécification XML, ce qu'on appelle l'espace est toute séquence de combinaison de quatre caractères :
---------------- --- -----
caractère espace (espace), la valeur du caractère correspondant est #x20
caractère de retour (retour chariot), la valeur du caractère correspondant est #xD
caractère de nouvelle ligne (nouvelle ligne), la valeur du caractère correspondante est #xA
Caractère de tabulation (Tab), la valeur du caractère correspondante est #x9.

Les espaces dans le fichier XML formeront également des nœuds, qui sont des nœuds spatiaux. Les nœuds spatiaux appartiennent au type de nœud texte.

Pour XML et XSLT, les nœuds spatiaux impliqueront deux problèmes :
------------------------
1. Pour déterminer quels espaces du fichier d'entrée XML sont importants, le processeur XSLT doit voir ces nœuds d'espace. La clé de la décision est l’attribut xml:space.
2. Déterminez quels espaces sont importants dans le fichier modèle XSL, le processeur XSLT doit le copier dans l'arborescence des résultats et la clé de la décision réside dans les deux commandes xsl:strip-space
et xsl:preserve-space.


"Nœuds spatiaux importants et sans importance"
-------------------------
Si quelqu'un Le le contenu d'un composant ne peut contenir que des composants, alors les nœuds spatiaux du composant sont insignifiants ;
Si le contenu d'un composant est de type #PCDATA, les nœuds spatiaux qu'il contient doivent être considérés comme importants (significatifs).
Quant à la situation où le contenu du composant est un mélange de contenu textuel et de composants, il est impossible de juger cela devrait dépendre de la signification sémantique du composant et de son contenu.


Avant que le processeur xslt n'entre en contact avec le fichier d'entrée XML, celui-ci sera analysé par l'analyseur XML
————————————————— ————————————— ---
(1) L'attribut xml:space peut modifier le mode de traitement des nœuds spatiaux par les applications XML ultérieures. Par exemple, le processeur xslt sera affecté par. l'attribut xml:space.
(2) Les symboles de fin à la fin de toute marque de colonne ou contenu dans le fichier XML seront remplacés par un seul caractère de nouvelle ligne (#xA).
(3) Avant que la valeur de l'attribut ne soit transmise à l'application XML, l'analyseur XML doit également effectuer des opérations standardisées sur la valeur de l'attribut. En effet, différents systèmes d'exploitation ont différentes combinaisons de caractères de fin de chaque ligne de texte. Par exemple, le système Windows se terminera par le caractère de retour et le caractère de nouvelle ligne, tandis que le système Unix se terminera uniquement par le groupe de caractères de nouvelle ligne. Symbole
. Une fois que l'analyseur XML a lu le fichier XML, il remplace d'abord tous les symboles de fin par un seul caractère de nouvelle ligne. Cela unifie non seulement les différences dans la conception des différents symboles de fin entre les différents systèmes, mais simplifie également le fonctionnement des applications XML ultérieures. . Un tel processus est appelé « normalisation ».
a, le symbole de fin de chaque colonne de texte doit être normalisé en un seul caractère de nouvelle ligne (#xA).
b, tout caractère espace (#x20, #xD, #xA, #x9) doit être remplacé par un caractère espace (#x20).
c, si la valeur de l'attribut contient un code de paramètre de mot, il doit être remplacé par le caractère de référence, par exemple, Sera remplacé par des caractères de nouvelle ligne (#xA).
d. Si la valeur de l'attribut contient une référence d'entité, elle doit être remplacée par son texte de remplacement.
e, tous les caractères autres que cela doivent être mis directement dans la valeur d'attribut normalisée.
f. Enfin, si le type d'attribut n'est pas CDATA, l'analyseur XML doit en outre supprimer la séquence de caractères d'espace avant et après la valeur de l'attribut, et s'il y a une séquence d'espaces au milieu de la valeur de l'attribut, elle doit également être remplacé par un seul espace.


Une fois que le processeur XSLT a construit l'arborescence structurelle du fichier d'entrée XML et du fichier modèle XSL, il fusionnera les nœuds de texte adjacents dans le composant en un seul nœud de texte, puis fusionnera certains nœuds de texte supprimés. . Cependant, si le nœud de texte remplit une des conditions suivantes, il sera conservé :
-----------------
(1) Le composant parent du texte node est membre de l'ensemble de noms d'éléments préservant les espaces.
(2) Il y a au moins un caractère autre qu'un espace dans le nœud de texte.
(3) Il existe un attribut xml:space dans un composant ancêtre du nœud de texte, sa valeur est conservée et il n'y a pas d'autre valeur d'attribut xml:space dans le composant ancêtre récent qui est par défaut. Les autres nœuds de texte seront supprimés.


Pour les modèles XML, le jeu de noms de composants dit de préservation d'espace n'a qu'un seul composant XSL:text disponible. Les nœuds spatiaux du fichier modèle XSL seront supprimés, mais s'ils apparaissent dans le composant xsl:text, ils seront conservés.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn