Maison >développement back-end >Tutoriel XML/RSS >Problèmes et solutions concernant UTF-16
Le service Sitemap de Google exige que tous les plans de site publiés soient encodés au format UTF-8 d'Unicode. Google n'autorise même pas d'autres encodages Unicode comme UTF-16, encore moins les encodages non Unicode comme ISO-8859-1. Techniquement, cela signifie que Google utilise un analyseur XML non standard, car la recommandation XML exige spécifiquement que « tous les gestionnaires XML doivent accepter les encodages UTF-8 et UTF-16 d'Unicode 3.1 », mais est-ce vraiment un gros problème ? UTF-8 est accessible à tous. L'ubiquité est la première et la plus convaincante raison de choisir UTF-8. Il peut gérer tous les scripts actuellement utilisés dans le monde. Même s’il existe encore quelques lacunes, elles deviennent de moins en moins évidentes et se comblent progressivement. Les littéraux qui ne sont pas inclus ne sont généralement implémentés dans aucun autre jeu de caractères, et même s'ils le sont, ils ne peuvent pas être utilisés en XML. Dans le meilleur des cas, ces scripts sont transmis via l'emprunt de polices à un jeu de caractères à un octet comme Latin-1. Un véritable support pour un texte aussi rare pourrait d'abord provenir d'Unico
1 Détails sur l'encodage de documents XML à l'aide de UTF-8
<.>
Introduction : Le service Sitemap de Google exige que tous les plans de site publiés soient encodés en Unicode UTF-8. Google n'autorise même pas d'autres encodages Unicode comme UTF-16, encore moins les encodages non Unicode comme ISO-8859-1. Techniquement, cela signifie que Google utilise un analyseur XML non standard, car la recommandation XML exige spécifiquement que « tous les gestionnaires XML doivent accepter les encodages UTF-8 et UTF-16 d'Unicode 3.1 », mais est-ce vraiment un gros problème ?
2. Présentez en détail certaines choses liées au codepoint et à l'UTF-16 en Java
Introduction : La relation entre Unicode et UTF-8/UTF-16/UTF-32 La relation entre Unicode et UTF-8/UTF-16/UTF-32 est la relation entre les caractères réglage et encodage. Le concept de jeu de caractères comprend en fait deux aspects : l’un est le jeu de caractères et l’autre est le schéma de codage. Un jeu de caractères définit tous les symboles qu'il contient. Un jeu de caractères au sens étroit n'inclut pas de schéma de codage. Il définit simplement tous les symboles qui appartiennent à ce jeu de caractères. Mais d’une manière générale, un jeu de caractères ne définit pas seulement une collection de caractères, il définit également un codage binaire pour chaque symbole. Quand on mentionne GB2312 ou ASCII, cela implique...
3 Nouvelles fonctionnalités de java 8 Update 20 - Déduplication de chaînes
Introduction : Les chaînes occupent beaucoup de mémoire dans n'importe quelle application. En particulier, les tableaux char[] contenant des caractères UTF-16 individuels contribuent le plus à la consommation de mémoire JVM, car chaque caractère occupe 2 bits. Il est en fait très courant que 30 % de la mémoire soit consommée par des chaînes
4.
la page php utilise include pour introduire headerphp et il y a une ligne vide au-dessus de l'en-tête. . Comment utiliser include include html include
Introduction : include, en-tête : la page php utilise include pour introduire headerphp et il y a une ligne vide au-dessus de l'en-tête : Ce problème a été cela me dérange depuis longtemps. Ce problème est résolu ici. La clé Il y a eu un problème avec l'encodage du code. Le format d'encodage utilisé dans le header.php de ma page est UTF-8 avec BOM. Modifiez le code avec BOM en no BOM, afin que la ligne vide dans l'en-tête disparaisse. La nomenclature UTF-8 est également appelée signature UTF-8. En fait, la nomenclature UTF-8 n'a aucun effet sur UFT-8. Elle est ajoutée pour prendre en charge UTF-16 et UTF-32. le fichier actuel. Quel type de codage doit être utilisé5.
L'efficacité et la fonction de la poudre de spores de Ganoderma lucidum et comment la consommer. normalement dans n'importe quel jeu de caractères (suite) Introduction : L'efficacité et la fonction de la poudre de spores de Ganoderma lucidum et comment la consommer : L'efficacité et le rôle de la poudre de spores de Ganoderma lucidum et comment la consommer Méthode 2 d'affichage normal de la page Web dans n'importe quel jeu de caractères (suite ) : avant de transférer vers : coolcode.cn Il y a quelques jours, j'ai écrit un article sur la façon d'afficher normalement les pages Web dans n'importe quel jeu de caractères. L'introduction était très simple, c'est-à-dire que les jeux de caractères autres que les 128 premiers caractères sont représentés par. NCR Cependant, je n'ai pas introduit la méthode de conversion spécifique car à l'époque, cela me paraissait trop simple. Mais plus tard, j'ai découvert que quelqu'un avait posé cette question, je vais donc l'expliquer en détail ici. La première étape consiste à convertir la chaîne du jeu de caractères source en jeu de caractères UTF-16. Cette étape est due au fait que chaque caractère du jeu de caractères UTF-16 fait deux octets et qu'il est facile à traiter plus tard, <.> 6. PHP supprime le code d'en-tête de nomenclature Introduction : PHP supprime le code d'en-tête de nomenclature
La nomenclature UTF-8 est également appelée signature UTF-8. En fait, la nomenclature UTF-8 n'a aucun effet sur UFT-8. Elle est ajoutée pour prendre en charge UTF-16 et UTF-32. le fichier actuel. Quel encodage doit-on utiliser pour permettre à l'éditeur de l'identifier plus facilement ? Cependant, même si la nomenclature n'est pas affichée dans l'éditeur, elle produira une sortie, tout comme une ligne vierge supplémentaire.
Si cela se produit après avoir modifié un fichier PHP :
* Impossible de se connecter ou de se déconnecter ;
* Une ligne vide apparaît en haut de la page ;
* Haut de la page 7. Je vous prie de m'aider à résoudre certains doutes sur la façon d'obtenir des données de nœud XML en php Introduction : Je vous supplie de m'aider à résoudre le petit problème d'obtention des données du nœud XML en php, je suis tellement stupide que je veux obtenir la valeur de
8. Un seul octet à un octet large
Introduction : Un seul octet à un octet large Ce message a été modifié pour la dernière fois par sevencolours24 le 2013-02-28 16:05. :54 $msg="Chine" Maintenant, je souhaite envoyer ce msg à une autre application pour le recevoir. Comment convertir le msg en octets larges codés en utf-16 afin que l'application puisse l'afficher normalement ? Je l'ai envoyé directement maintenant et j'ai découvert qu'il s'agissait d'un seul octet. -----
9. Est-il possible de convertir l'encodage utf16be en utf8 en php ?
Introduction : php Est-il possible de convertir l'encodage chinois utf16be en utf8 ? Les données de utf16be doivent être converties en données utf8 (il est normal de convertir le chinois utf-8 directement en gbk, mais les lettres ne sont pas normales). Existe-t-il un moyen disponible ? J'ai vérifié en ligne et je ne l'ai pas trouvé. ------Solution----------------------$text = iconv('utf-16be', 'utf-8', $t
[Recommandations de questions et réponses associées] :
Java - Problème d'encodage UTF-16
Questions de programmation C++ à propos de la version ascll ou de la version unicode, dont l'encodage est la version unicode
Questions sur les points de code et les unités de code pour char et String en Java
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!