Maison  >  Article  >  Qu’est-ce qui est utilisé pour stocker les caractères chinois dans les ordinateurs ?

Qu’est-ce qui est utilisé pour stocker les caractères chinois dans les ordinateurs ?

青灯夜游
青灯夜游original
2020-12-07 10:17:2331766parcourir

Les caractères chinois dans les ordinateurs sont stockés à l'aide de codes internes. Les codes internes chinois font référence à des codes composés de symboles 0 et 1 utilisés dans le stockage interne de l'ordinateur, le traitement et la transmission des caractères chinois. . Codage, quel que soit le système de caractères chinois et la méthode de saisie des caractères chinois, le code externe du caractère chinois saisi doit être converti en un code interne à l'intérieur de la machine avant de pouvoir être stocké et traité de diverses manières.

Qu’est-ce qui est utilisé pour stocker les caractères chinois dans les ordinateurs ?

L'environnement d'exploitation de cet article : système Windows 7, ordinateur Dell G3.

Les caractères chinois dans l'ordinateur sont stockés à l'aide de codes internes.

Le code interne des caractères chinois, également connu sous le nom de « code ASCII des caractères chinois », appelé « code interne », fait référence au stockage interne, au traitement et à la transmission des caractères chinois par l'ordinateur, constitués de symboles 0 et 1. Une fois le code d'entrée accepté, il est converti en code interne par le « module de conversion de code d'entrée » du système d'exploitation de caractères chinois, quelle que soit la méthode de saisie au clavier utilisée. Le code intégré à la machine est le codage le plus basique des caractères chinois. Quels que soient le système de caractères chinois et la méthode de saisie des caractères chinois, le code externe du caractère chinois saisi doit être converti en code intégré à la machine avant de pouvoir être utilisé. être stockés et traités de diverses manières.

Explication détaillée

Étant donné que le système de traitement des caractères chinois doit garantir la compatibilité entre les langues chinoises et occidentales, une ambiguïté se produira lorsque le code ASCII et le code standard national des caractères chinois existent dans le système. . Par exemple : il y a deux octets de contenu 30H et 21H, qui peuvent représenter le code standard national du caractère chinois « ah » et le code ASCII du « 0 » et du « ! » espagnols. Pour cette raison, le code des caractères chinois intégré à la machine doit être traité de manière appropriée et transformé en code standard national.

Le code intégré au code standard national est un code long de deux octets. Il ajoute « 1 » au bit le plus élevé de chaque octet du code standard national correspondant, c'est-à-dire

<.>Code de caractère chinois dans la machine = code standard national de caractère chinois + 8080H

Par exemple, le code standard national du caractère « ah » mentionné ci-dessus est 3021H, et son code interne de caractère chinois est B0A1H.

La base du code des caractères chinois dans la machine est le code standard national des caractères chinois.

Code intégré : afin d'éviter les problèmes d'ambiguïté lorsque des codes ASCII et des codes standard nationaux sont utilisés en même temps, la plupart des systèmes de caractères chinois utilisent la position haute 1 de chaque octet du code standard national comme code machine pour les caractères chinois. Cela résout non seulement l'ambiguïté entre le code machine des caractères chinois et le code machine occidental, mais permet également au code machine des caractères chinois et au code standard national d'avoir une relation de correspondance très simple.

La relation entre le code interne des caractères chinois, le code standard national et le code de localisation est la suivante : les deux octets du code de localisation (décimal) sont convertis en hexadécimal puis ajoutés avec 2020H pour obtenir la norme nationale correspondante code ; Le code interne est le bit le plus élevé des deux octets du code d'échange de caractères chinois (code standard national) plus 1 respectivement, c'est-à-dire que les deux octets du code d'échange de caractères chinois (code standard national) sont ajoutés avec 80H à obtenir le code interne correspondant ; indicatif régional (décimal) Les deux octets sont convertis en hexadécimal puis A0H est ajouté pour obtenir le code interne correspondant.

Recommandations associées : "

Introduction à la programmation"

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn