ホームページ  >  記事  >  漢字の国家標準コードは何バイトのストレージを占有しますか?

漢字の国家標準コードは何バイトのストレージを占有しますか?

青灯夜游
青灯夜游オリジナル
2019-06-04 09:32:2946971ブラウズ

漢字の国家標準コードは何バイトのストレージを占有しますか?

中国語文字国家標準コードは、各漢字に対して国家的に統一されたコードを持つために、漢字エンコーディングの国家標準を公布することを目的として 1980 年に作成されました。各漢字には、漢字国家標準コードと呼ばれるバイナリ コードがあります。私の国の中国語文字コード標準 GB2312-80 には、バイナリ エンコーディングを指定する一般的に使用される中国語の文字が 6763 個あります。

国家標準コードは、漢字交換コードとも呼ばれ、コンピュータ間で漢字情報を交換する際に使用されるコード標準です。国家標準コードは 2 バイトで表されます。つまり、各漢字は 2 バイトで表されます。

GB2312-80 GB2312は、コードテーブルを1バイト目に相当する94個の領域に分割し、各領域は2バイト目に相当する94ビットを持ち、2バイトの値がエリアコード値となります。およびビット 数値に 32 (20H) を加算します。領域 01 ~ 09 は記号と数字、領域 16 ~ 87 は漢字、領域 10 ~ 15 と 88 ~ 94 はさらなる標準化が必要な空白領域です。 GB2312 は、収集された漢字を 2 つのレベルに分けています。第 1 レベルには、一般的に使用される 3755 文字が含まれ、エリア 16 ~ 55 に配置され、中国語のピンイン文字/ストローク形状の順序で配置されています。第 2 レベルの漢字には、常用漢字3008文字を56~87のエリアに配置し、部首・書き順に並べています。したがって、GB2312 は最大 6763 文字の漢字を表現できます。

以上が漢字の国家標準コードは何バイトのストレージを占有しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。