Maison >développement back-end >Tutoriel XML/RSS >Problèmes et solutions concernant UTF-16

Problèmes et solutions concernant UTF-16

零下一度
零下一度original
2017-06-12 13:08:313302parcourir

Le service Sitemap de Google exige que tous les plans de site publiés soient encodés au format UTF-8 d'Unicode. Google n'autorise même pas d'autres encodages Unicode comme UTF-16, encore moins les encodages non Unicode comme ISO-8859-1. Techniquement, cela signifie que Google utilise un analyseur XML non standard, car la recommandation XML exige spécifiquement que « tous les gestionnaires XML doivent accepter les encodages UTF-8 et UTF-16 d'Unicode 3.1 », mais est-ce vraiment un gros problème ? UTF-8 est accessible à tous. L'ubiquité est la première et la plus convaincante raison de choisir UTF-8. Il peut gérer tous les scripts actuellement utilisés dans le monde. Même s’il existe encore quelques lacunes, elles deviennent de moins en moins évidentes et se comblent progressivement. Les littéraux qui ne sont pas inclus ne sont généralement implémentés dans aucun autre jeu de caractères, et même s'ils le sont, ils ne peuvent pas être utilisés en XML. Dans le meilleur des cas, ces scripts sont transmis via l'emprunt de polices à un jeu de caractères à un octet comme Latin-1. Un véritable support pour un texte aussi rare pourrait d'abord provenir d'Unico

1 Détails sur l'encodage de documents XML à l'aide de UTF-8

<.>Problèmes et solutions concernant UTF-16

Introduction : Le service Sitemap de Google exige que tous les plans de site publiés soient encodés en Unicode UTF-8. Google n'autorise même pas d'autres encodages Unicode comme UTF-16, encore moins les encodages non Unicode comme ISO-8859-1. Techniquement, cela signifie que Google utilise un analyseur XML non standard, car la recommandation XML exige spécifiquement que « tous les gestionnaires XML doivent accepter les encodages UTF-8 et UTF-16 d'Unicode 3.1 », mais est-ce vraiment un gros problème ?

2. Présentez en détail certaines choses liées au codepoint et à l'UTF-16 en Java

Problèmes et solutions concernant UTF-16

Introduction : La relation entre Unicode et UTF-8/UTF-16/UTF-32 La relation entre Unicode et UTF-8/UTF-16/UTF-32 est la relation entre les caractères réglage et encodage. Le concept de jeu de caractères comprend en fait deux aspects : l’un est le jeu de caractères et l’autre est le schéma de codage. Un jeu de caractères définit tous les symboles qu'il contient. Un jeu de caractères au sens étroit n'inclut pas de schéma de codage. Il définit simplement tous les symboles qui appartiennent à ce jeu de caractères. Mais d’une manière générale, un jeu de caractères ne définit pas seulement une collection de caractères, il définit également un codage binaire pour chaque symbole. Quand on mentionne GB2312 ou ASCII, cela implique...

3 Nouvelles fonctionnalités de java 8 Update 20 - Déduplication de chaînes

Problèmes et solutions concernant UTF-16

Introduction : Les chaînes occupent beaucoup de mémoire dans n'importe quelle application. En particulier, les tableaux char[] contenant des caractères UTF-16 individuels contribuent le plus à la consommation de mémoire JVM, car chaque caractère occupe 2 bits. Il est en fait très courant que 30 % de la mémoire soit consommée par des chaînes

4.

la page php utilise include pour introduire headerphp et il y a une ligne vide au-dessus de l'en-tête. . Comment utiliser include include html include

Introduction : include, en-tête : la page php utilise include pour introduire headerphp et il y a une ligne vide au-dessus de l'en-tête : Ce problème a été cela me dérange depuis longtemps. Ce problème est résolu ici. La clé Il y a eu un problème avec l'encodage du code. Le format d'encodage utilisé dans le header.php de ma page est UTF-8 avec BOM. Modifiez le code avec BOM en no BOM, afin que la ligne vide dans l'en-tête disparaisse. La nomenclature UTF-8 est également appelée signature UTF-8. En fait, la nomenclature UTF-8 n'a aucun effet sur UFT-8. Elle est ajoutée pour prendre en charge UTF-16 et UTF-32. le fichier actuel. Quel type de codage doit être utilisé

5.

L'efficacité et la fonction de la poudre de spores de Ganoderma lucidum et comment la consommer. normalement dans n'importe quel jeu de caractères (suite)

Introduction : L'efficacité et la fonction de la poudre de spores de Ganoderma lucidum et comment la consommer : L'efficacité et le rôle de la poudre de spores de Ganoderma lucidum et comment la consommer Méthode 2 d'affichage normal de la page Web dans n'importe quel jeu de caractères (suite ) : avant de transférer vers : coolcode.cn Il y a quelques jours, j'ai écrit un article sur la façon d'afficher normalement les pages Web dans n'importe quel jeu de caractères. L'introduction était très simple, c'est-à-dire que les jeux de caractères autres que les 128 premiers caractères sont représentés par. NCR Cependant, je n'ai pas introduit la méthode de conversion spécifique car à l'époque, cela me paraissait trop simple. Mais plus tard, j'ai découvert que quelqu'un avait posé cette question, je vais donc l'expliquer en détail ici. La première étape consiste à convertir la chaîne du jeu de caractères source en jeu de caractères UTF-16. Cette étape est due au fait que chaque caractère du jeu de caractères UTF-16 fait deux octets et qu'il est facile à traiter plus tard, <.>

6. PHP supprime le code d'en-tête de nomenclature

Introduction : PHP supprime le code d'en-tête de nomenclature La nomenclature UTF-8 est également appelée signature UTF-8. En fait, la nomenclature UTF-8 n'a aucun effet sur UFT-8. Elle est ajoutée pour prendre en charge UTF-16 et UTF-32. le fichier actuel. Quel encodage doit-on utiliser pour permettre à l'éditeur de l'identifier plus facilement ? Cependant, même si la nomenclature n'est pas affichée dans l'éditeur, elle produira une sortie, tout comme une ligne vierge supplémentaire. Si cela se produit après avoir modifié un fichier PHP : * Impossible de se connecter ou de se déconnecter ; * Une ligne vide apparaît en haut de la page ; * Haut de la page

7. Je vous prie de m'aider à résoudre certains doutes sur la façon d'obtenir des données de nœud XML en php

Introduction : Je vous supplie de m'aider à résoudre le petit problème d'obtention des données du nœud XML en php, je suis tellement stupide que je veux obtenir la valeur de dests>=530000. Pourriez-vous s'il vous plaît me donner un message ? Code détaillé ? Le code des données est le suivant :

8. Un seul octet à un octet large

Introduction : Un seul octet à un octet large Ce message a été modifié pour la dernière fois par sevencolours24 le 2013-02-28 16:05. :54 ​ ​ ​ ​ $msg="Chine" Maintenant, je souhaite envoyer ce msg à une autre application pour le recevoir. Comment convertir le msg en octets larges codés en utf-16 afin que l'application puisse l'afficher normalement ? Je l'ai envoyé directement maintenant et j'ai découvert qu'il s'agissait d'un seul octet.                                   -----

9. Est-il possible de convertir l'encodage utf16be en utf8 en php ?

Introduction : php Est-il possible de convertir l'encodage chinois utf16be en utf8 ? Les données de utf16be doivent être converties en données utf8 (il est normal de convertir le chinois utf-8 directement en gbk, mais les lettres ne sont pas normales). Existe-t-il un moyen disponible ? J'ai vérifié en ligne et je ne l'ai pas trouvé. ------Solution----------------------$text = iconv('utf-16be', 'utf-8', $t

[Recommandations de questions et réponses associées] :

Java - Problème d'encodage UTF-16

Questions de programmation C++ à propos de la version ascll ou de la version unicode, dont l'encodage est la version unicode

Questions sur les points de code et les unités de code pour char et String en Java

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn