Maison >Problème commun >Le code interne d'un caractère chinois nécessite plusieurs octets pour être stocké
Le code interne d'un caractère chinois nécessite 2 octets pour être stocké. Dans le système de caractères chinois populaire en Chine, le code interne d'un caractère chinois occupe 2 octets. Étant donné que le système de traitement des caractères chinois doit assurer la compatibilité entre les langues chinoises et occidentales, une ambiguïté se produira lorsque des codes ASCII et des codes standard nationaux de caractères chinois existent dans le système. ; À cette fin, le code interne des caractères chinois doit être traité de manière appropriée et transformé en code standard national.
L'environnement d'exploitation de cet article : système Windows 10, ordinateur thinkpad t480.
Combien d'octets sont nécessaires pour stocker le code interne d'un caractère chinois ?
Le code interne d'un caractère chinois nécessite 2 octets pour être stocké.
Le Bureau national des normes de mon pays a promulgué le « Jeu de caractères codés chinois pour l'échange d'informations - Jeu de base » en mai 1981, nommé GB2312-80, avec un total de 6 763 caractères chinois et 682 caractères graphiques Le codage est effectué, et le principe de codage est le suivant : les caractères chinois sont représentés par deux octets.
En principe, deux octets peuvent représenter 256×256=65536 symboles différents, ce qui est réalisable comme base pour la représentation du codage des caractères chinois. Cependant, compte tenu de la relation entre le codage des caractères chinois et d'autres codages universels internationaux, tels que le codage des caractères occidentaux ASCII, le Bureau national des normes de mon pays a adopté un schéma de codage des caractères chinois modifié à deux octets, en utilisant uniquement les 7 bits inférieurs des deux octets.
Cette solution peut accueillir 128×128=16384 caractères chinois différents, mais afin d'être compatible avec le code ASCII standard, 32 codes de fonction de contrôle et espaces avec une valeur de code de 32 et 32 espaces ne peuvent pas être utilisés dans chaque octet. L'opcode de 127. Il ne peut donc y avoir que 94 encodages par octet. De cette façon, le nombre réel de mots pouvant être représentés par deux chiffres à sept chiffres est : 94×94=8836.
Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!