Maison >développement back-end >tutoriel php >Quelles sont les différences entre gb2312 et utf-8 ? Comment choisir ? (Résumer)

Quelles sont les différences entre gb2312 et utf-8 ? Comment choisir ? (Résumer)

藏色散人
藏色散人original
2018-10-10 14:13:1911998parcourir

Cet article vous présente principalement la différence entre gb2312 et utf-8.

Je pense que tout le monde devrait savoir que les caractères chinois ne peuvent pas être stockés directement dans l'ordinateur, mais que les codes sont stockés.

Ensuite, il y aura différents encodages de caractères selon différentes exigences environnementales.

GB2312 et utf-8 sont tous deux des encodages de caractères. Dans l'article précédent [Quelles sont les différences entre gbk et gb2312 ? ], nous avons résumé les différences entre gbk et gb2312, et avons également présenté en détail ce qu'est le codage de caractères ? Les amis dans le besoin peuvent y aller et s'y référer.

GB2312 est un jeu de caractères chinois simplifié, composé de 6763 caractères chinois couramment utilisés et de 682 caractères non chinois pleine chasse. gb2312 est une norme nationale et une bibliothèque de caractères chinois. Elle couvre uniquement les caractères chinois et certaines langues étrangères couramment utilisées, telles que le katakana japonais, et les symboles courants.

UTF-8 (transformation Unicode 8 bits Format) est un codage de caractères de longueur variable pour Unicode, également connu sous le nom d'Unicode, créé par Ken Thompson en 1992. Maintenant standardisé sous le nom de RFC 3629. UTF-8 encode les caractères Unicode en utilisant 1 à 6 octets.

UTF-8 stocke 3 octets d'un caractère chinois. Dans gb2312, un caractère chinois est stocké sur 2 octets.

Quelles sont les différences entre gb2312 et utf-8 ? Comment choisir ? (Résumer)

La principale différence entre gb2312 et utf-8 :

À propos de la taille de la police : UTF-8 > caractère et gb2312 n'a que des caractères chinois)

À propos de la taille de sauvegarde : UTF-8> gb2312 (utf8 est plus volumineux et se charge plus lentement, gb2312 est plus petit et se charge plus rapidement)

À propos du champ d'application : gb2312 est principalement utilisé en Chine continentale. Il s'agit d'un jeu de caractères localisé qui contient des caractères nécessaires à tous les pays du monde. forte polyvalence. Le texte codé en UTF-8 peut être affiché sur les navigateurs de divers pays prenant en charge le jeu de caractères UTF8.

Alors comment choisir le codage lors du développement du projet ?

Cela oblige chacun à faire un choix en fonction de ses propres besoins et des avantages des différents encodages.

Par exemple, si le site Web contient beaucoup de données et s'adresse uniquement aux utilisateurs nationaux, il est recommandé d'utiliser l'encodage gb2312.

Si le site Web a beaucoup de contenu en anglais ou un site Web d'entreprise avec peu de contenu, il est recommandé d'utiliser l'encodage UTF-8.

Ceci est principalement sélectionné en fonction des différents espaces de stockage de base de données de codage gb2312 et utf8.

Cet article traite de la différence entre gb2312 et utf-8 J'espère qu'il sera utile aux amis dans le besoin !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn