Maison >interface Web >tutoriel HTML >Comment choisir gbk utf8 Comprendre et utiliser correctement l'encodage des pages Web GBK et UTF-8_HTML/Xhtml_production de pages Web

Comment choisir gbk utf8 Comprendre et utiliser correctement l'encodage des pages Web GBK et UTF-8_HTML/Xhtml_production de pages Web

WBOY
WBOYoriginal
2016-05-16 16:40:451888parcourir

Le codage de page Web est traduit en anglais par encodage de page Web, qui est une bibliothèque qui spécifie son format de codage de caractères spécifique dans les pages Web.
GBK est une norme compatible avec GB2312 après extension basée sur la norme nationale GB2312. Le codage de texte de GBK est représenté par des octets doubles, c'est-à-dire que les caractères chinois et anglais sont représentés par des octets doubles. Afin de distinguer les caractères chinois, les bits les plus élevés sont définis sur 1. GBK contient tous les caractères chinois et constitue un codage national. Il est moins polyvalent que UTF8, mais UTF8 occupe une base de données plus grande que GBK.

UTF-8 : Unicode TransformationFormat-8bit, la nomenclature est autorisée, mais la nomenclature n'est généralement pas incluse. Il s'agit d'un codage multi-octets utilisé pour résoudre les caractères internationaux. Il utilise 8 bits (soit un octet) pour l'anglais et 24 bits (trois octets) pour le chinois. UTF-8 contient des caractères utilisés par tous les pays du monde. Il s’agit d’un codage international doté d’une grande polyvalence. Le texte codé en UTF-8 peut être affiché sur les navigateurs de divers pays prenant en charge le jeu de caractères UTF8. S'il s'agit d'un encodage UTF8, le chinois peut également être affiché sur l'IE anglais des étrangers, et ils n'ont pas besoin de télécharger le package de prise en charge de la langue chinoise d'IE.
Bien que la version UTF-8 ait une bonne compatibilité internationale, la version chinoise nécessite 50 % d'espace de stockage de base de données en plus que la version GBK/BIG5, elle n'est donc pas recommandée et ne peut être utilisée que par des utilisateurs ayant des exigences particulières en matière de compatibilité internationale. Pour faire simple : pour les sites Web comportant davantage de caractères chinois, il convient d’utiliser l’encodage GBK pour économiser de l’espace dans la base de données. Pour les sites Web contenant davantage d’anglais, il est approprié d’utiliser UTF-8 pour économiser de l’espace dans la base de données.

Comment convertir GBK, GB2312, etc. en UTF8 ? Le codage Unicode doit être utilisé pour convertir GBK, GB2312, etc. en UTF8 : GBK, GB2312—Unicode—UTF8—Unicode—GBK, GB2312 ; En utilisant « Enregistrer sous » dans le Bloc-notes Windows, vous pouvez effectuer une conversion entre les méthodes d'encodage GBK, Unicode, Unicode big endian et UTF-8.

Comment faire en sorte que le navigateur identifie correctement l'encodage de la page Web ? Généralement, il doit y avoir la phrase suivante dans la page Web : , indiquant que le codage du jeu de caract猫res de cette page Web est GB2312. (Ou UTF-8)
Pourquoi la page pr茅cise-t-elle parfois l'encodage et appara卯t-elle parfois tronqu茅e ? Cela peut 锚tre d没 au fait que le codage de la d茅claration de la page est incompatible avec le codage du fichier lui-m锚me. Le plus souvent, la page est ouverte avec un mauvais codage puis enregistr茅e, ou un logiciel FTP est utilis茅 pour modifier directement le fichier en ligne, tel que CuteFTP. . L'erreur de conversion se produit en raison d'une configuration de codage logicielle incorrecte.

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn