Maison  >  Article  >  développement back-end  >  Explication détaillée des exemples de codage XML de base

Explication détaillée des exemples de codage XML de base

Y2J
Y2Joriginal
2017-05-08 10:02:451732parcourir

Les documents XML peuvent contenir des caractères étrangers tels que le norvégien ou le français (le chinois bien sûr ! Cette partie ne peut toujours pas être traduite selon le texte original, une partie du contenu ci-dessous est écrite par moi-même)
Afin que votre analyseur puisse comprendre ces caractères , vous devez Une norme de codage de caractères unifiée dans les documents XML.

Bloc-notes Windows 95/98
Le Bloc-notes Windows 95/98 ne peut pas enregistrer les fichiers au format d'encodage Unicode.
Vous pouvez utiliser le Bloc-notes pour modifier et enregistrer des documents XML contenant des caractères étrangers (par exemple : norvégien ou français ou chinois)

>Xiaoyi
<à>Xiaolin


Mais si vous utilisez un navigateur pour ouvrir ce document XML édité avec le Bloc-notes, une erreur "ouvrez-le avec IE 5.0" apparaîtra.

Utilisation de l'encodage dans le Bloc-notes Windows 95/98
Les fichiers XML d'édition du Bloc-notes Windows 95/98 doivent être codés
paramètres d'attribut
. Afin d'éviter les erreurs, vous pouvez ajouter un attribut d'encodage à la déclaration du document XML pour indiquer le type d'encodage de ce document XML, mais n'utilisez pas l'encodage Unicode. Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois s'affichent normalement :
ne provoque pas d'erreurs Erreur et les caractères chinois s'affichent normalement :


Les types d'encodage suivants ne provoquent pas d'erreurs et les caractères chinois s'affichent anormalement (caractères tronqués) :


Le type d'encodage suivant ne provoquera pas d'erreurs, et les caractères chinois ne le feront pas être affiché normalement (caractères tronqués) :


Le type d'encodage suivant ne provoquera pas d'erreurs, et les caractères chinois s'affichent normalement :


Les types d'encodage suivants provoqueront des erreurs :


Utiliser le Bloc-notes Windows 2000
Le Bloc-notes Windows 2000 peut enregistrer des fichiers au format de codage Unicode.
Le Bloc-notes pour Windows 2000 prend en charge le jeu de caractères Unicode. Si vous utilisez le Bloc-notes Win2000 pour enregistrer le document XML au format de codage Unicode (veuillez noter qu'il n'y a aucune information de codage dans la déclaration XML) :
;< ;de>Xiaoxi<à>XiaolinAllons ensemble au hotpot le soir


Le fichier suivant ; note_encode_none_u .xml, il n'y aura aucune erreur dans IE5.0+, mais si vous utilisez Netscape 6.2, des erreurs peuvent survenir. Les lecteurs comparent les deux fichiers note_encode_none.xml et note_encode_none_u.xml s'ils examinent leurs fichiers sources respectifs séparément, il n'y a pas de différence, mais pourquoi l'un peut-il être affiché et l'autre ne peut pas l'être ? La réponse est le jeu de caractères Unicode.

Encodage du Bloc-notes Windows 2000
Le Bloc-notes Windows 2000 peut également enregistrer des fichiers au format d'encodage "UTF-16".
Si vous déclarez l'attribut d'encodage dans le document XML et enregistrez le fichier au format d'encodage Unicode, une erreur peut survenir.
Le code suivant provoquera une erreur :


Le code suivant provoquera une erreur :


Le code suivant provoquera une erreur :


Le fichier suivant : note_encode_utf16_u.xml, s'affichera normalement dans IE5.0+, mais provoquera une erreur dans le navigateur Netscape 6.2.


Message d'erreur
Lors de la navigation dans des documents XML à l'aide d'IE5.0 ou version ultérieure, vous pouvez rencontrer deux encodages différents des erreurs ont été détectées :
Un caractère invalide a été trouvé dans le contenu du texte.
Si votre document XML ne correspond pas au format d'encodage de votre document XML, une erreur peut survenir. Habituellement, le document XML contient des caractères « non anglais » et utilise un
Éditeur
de codage sur un seul octet, et le format de codage du document XML n'est pas défini dans la déclaration du document XML.

Le passage du codage actuel au codage spécifié n’est pas pris en charge.
Si le document XML est enregistré au format de codage Unicode/UTF-16, mais que la déclaration du document XML définit le format de codage sur un codage sur un seul octet (tel que Windows-1252, ISO-8859-1 ou UTF -8) ; Ou bien le document XML est enregistré dans un format de codage sur un seul octet, mais la déclaration du document XML définit le format de codage comme étant une forme de codage Unicode/UTF-16. Dans les deux cas, des erreurs se produiront.

Conclusion
Conclusion : Définissez le format d'encodage du document dans la déclaration du document XML avant de l'enregistrer. Certaines de mes suggestions pour éviter les erreurs :
Utilisez un format d'encodage prenant en charge l'éditeur Unicode.
Assurez-vous de savoir quel encodage vous utilisez.
Utilisez les déclarations d'attributs dans les documents XML pour définir le format d'encodage.

[Recommandations associées]

1.Tutoriel vidéo gratuit XML

2.Manuel technique XML

3.Tutoriel booléen Tutoriel vidéo XML Yan Shiba

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn