Maison  >  Article  >  Quelle est la plage de codage gbk ?

Quelle est la plage de codage gbk ?

青灯夜游
青灯夜游original
2019-06-12 16:04:4119391parcourir

L'encodage GBK est une extension de l'encodage GB2312, il est donc entièrement compatible avec la norme GB2312-80. Le codage GBK utilise toujours un schéma de codage sur deux octets et sa plage de codage est la suivante : 8140-FEFE (octet de poids fort de 81 à FE, octet de poids faible de 40 à FE), à l'exclusion du point de code xx7F, soit un total de 23 940 points de code.

Quelle est la plage de codage gbk ?

L'encodage GBK contient un total de 21 886 caractères chinois et symboles graphiques, dont 21 003 caractères chinois (y compris les radicaux et les composants) et 883 symboles graphiques. L'encodage GBK prend en charge tous les caractères chinois, japonais et coréens de la norme internationale ISO/IEC10646-1 et de la norme nationale GB13000-1, et inclut tous les caractères chinois de l'encodage BIG5. Le schéma de codage GBK a été officiellement publié le 15 décembre 1995. Cette version de la spécification GBK est la version 1.0.

1. Allocation et séquence de points de code

GBK utilise également une représentation sur deux octets et la plage de codage globale est de 8140- FEFE Le premier octet est compris entre 81 et FE, le dernier octet est compris entre 40 et FE et une ligne de xx7F est exclue. Il existe un total de 23 940 points de code et un total de 21 886 caractères chinois et symboles graphiques sont inclus, dont 21 003 caractères chinois (y compris les radicaux et les composants) et 883 symboles graphiques.

Tout le codage est divisé en trois parties :

1.

Comprend :

a. Zone de caractères chinois GB 2312. C'est GBK/2 : B0A1-F7FE. Contient 6 763 Go de 2 312 caractères chinois, disposés dans l'ordre d'origine.

b. GB 13000.1 Développez la zone des caractères chinois. Comprend :

(1), GBK/3 : 8140-A0FE. Contient 6080 caractères chinois CJK en GB 13000.1.

(2) , GBK/4 : AA40-FEA0. Contient 8 160 caractères chinois CJK et des caractères chinois complétés. Les caractères chinois CJK sont au début, disposés en fonction de la taille du code UCS ; les caractères chinois supplémentaires (y compris les radicaux et les composants) sont à la fin, disposés en fonction du numéro de page/de la position des caractères du « Dictionnaire Kangxi ».

(3) Le caractère chinois "〇" est disposé dans la zone de symboles graphiques GBK/5 : A996.

2. Zone de symboles graphiques.

comprend :

a. Zone de symboles de caractères non chinois GB 2312. C'est GBK/1 : A1A1-A9FE. En plus des symboles du GB 2312, il existe 10 chiffres romains minuscules et symboles complétés par le GB 12345. Il y a 717 symboles au total.

b. GB 13000.1 Développez la zone des caractères non chinois. Il s'agit de GBK/5 : A840-A9A0. BIG-5 Les symboles de caractères non chinois, les symboles structurels et "〇" sont disposés dans cette zone. Il y a 166 symboles au total.

3. Zone définie par l'utilisateur :

est divisée en trois zones (1) (2) (3).

(1), AAA1-AFFE, 564 points de code.

(2), F8A1-FEFE, 658 points de code.

(3), A140-A7A0, 672 points de code.

Bien que la zone (3) soit ouverte aux utilisateurs, son utilisation est restreinte car la possibilité d'ajouter de nouveaux personnages à cette zone à l'avenir ne peut être exclue.

2. Glyphes

GBK a les dispositions suivantes pour les glyphes :

1. GB 13000.1 G Les glyphes/traits sous les colonnes (c'est-à-dire les caractères chinois dérivés des normes juridiques de la Chine continentale) restent cohérents.

2. Dans le cadre général des règles de reconnaissance des caractères chinois CJK, implémenter une « orthographe de codage non dupliquée » (« GB-isation ») pour tous les caractères chinois codés GBK ; essayez d'utiliser les nouveaux glyphes chinois.

3. Pour les caractères chinois qui dépassent les règles de reconnaissance des caractères chinois CJK, ou dont les règles de reconnaissance n'ont pas été clairement stipulées, les anciens glyphes sont temporairement placés dans les points de code GBK. De cette façon, dans de nombreux cas, GBK inclut à la fois des glyphes anciens et nouveaux du même caractère chinois.

4. Les glyphes des symboles non chinois qui sont déjà inclus dans le GB 2312 doivent être cohérents avec le GB 2312 ; les parties au-delà du GB 2312 doivent être cohérentes avec le GB 13000.1.

5. Les lettres Pinyin avec des tons sont en demi-largeur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn