Maison >développement back-end >Tutoriel XML/RSS >Introduction détaillée aux problèmes de codage et de vérification dans l'écriture de code XML

Introduction détaillée aux problèmes de codage et de vérification dans l'écriture de code XML

黄舟
黄舟original
2017-03-10 19:35:501499parcourir

Cet article présente principalement les problèmes d'encodage et de vérification de l'écriture de code XML. Semblable au HTML, l'encodage des fichiers XML peut également être spécifié dans le préambule. Les amis dans le besoin peuvent se référer à

Encodage.

Le codage est le processus de conversion des caractères Unicode en représentations binaires équivalentes. Lorsqu'un gestionnaire XML lit un document XML, il s'appuie sur le type de codage pour coder le document. Par conséquent, nous devons spécifier le type de codage dans la déclaration XML.

Type d'encodage
Il existe deux principaux types d'encodage :

UTF-8
UTF-16
UTF représente le format de conversion UCS, et UCS lui-même signifie jeu de caractères universel . Le chiffre 8 ou 16 indique le nombre de bits pour représenter le caractère. Ils sont au nombre de 8 (un octet) ou 16 (deux octets). Pour les documents sans informations de codage, UTF-8 est utilisé par défaut.

Syntaxe
Les informations d'encodage sont contenues dans le prologue du document XML. La syntaxe du codage UTF-8 est la suivante :

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

La syntaxe du codage UTF-16 est la suivante :

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

Exemple

L'exemple suivant montre la déclaration d'encodage :

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>  
  
    Tanmay Patil  
    TutorialsPoint  
    (011) 123-4567  

Dans l'exemple encoding="UTF-8" ci-dessus, il est spécifié d'utiliser 8 caractères de 3 bits. Pour utiliser 16 caractères, utilisez le codage UTF-16.

Les fichiers XML codés en UTF-8 sont plus petits que les fichiers au format UTF-16.

Validation

La validation est le processus de validation des documents XML. Un document est considéré comme valide si son contenu correspond aux éléments, attributs et définition de type de document (DTD) associé, et si le document est conforme aux contraintes exprimées par b. Il existe deux manières de gérer la validation via un analyseur XML. Ce sont :

Document XML bien formé
Document XML valide
Document XML bien formé
Un document XML est considéré comme bien formé s'il suit les règles suivantes.

Les documents XML sans DTD doivent utiliser des entités de caractères prédéfinies pour gérer amp(&), apos (guillemet simple), g(>), quot (guillemet double).
Doit suivre l'ordre des balises, par exemple, les balises internes doivent être fermées avant que les balises externes ne soient fermées.
Chaque balise de début doit avoir une balise de fin ou doit être une balise à fermeture automatique (b2386ffb911b14667cb8f0f91ea547a7...6e916e0f7d1e588d4f442bf645aedb2f ou d4bce3f20dbe5ab08417432e520da517).
Il ne doit y avoir qu'un seul attribut dans la balise de début, et il doit être placé entre guillemets.
À l'exception des entités amp(&), apos (guillemet simple), g(>), quot (guillemet double), les autres entités doivent être déclarées avant utilisation.
Exemple

Ce qui suit est un exemple de document XML bien formé :

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  
<!DOCTYPE address   
[   
<!ELEMENT address (name,company,phone)>  
    <!ELEMENT name (#PCDATA)>  
    <!ELEMENT company (#PCDATA)>  
    <!ELEMENT phone (#PCDATA)>  
]>  
<address>  
    <name>Tanmay Patil</name>  
    <company>TutorialsPoint</company>  
    <phone>(011) 123-4567</phone>  
</address>

L'exemple ci-dessus est considéré comme bien formé car :

Il définit le type de document. Et ici, le type de document est le type d'élément.
contient un élément racine nommé adresse.
Chaque nom d'élément enfant, entreprise et téléphone est une balise explicite et correctement fermée.
Les tags sont dans le bon ordre.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn