ホームページ  >  記事  >  漢字の内部コードを保存するには数バイトが必要です

漢字の内部コードを保存するには数バイトが必要です

青灯夜游
青灯夜游オリジナル
2020-12-14 17:45:0893479ブラウズ

漢字の内部コードを保存するには 2 バイトが必要です。中国で普及している漢字システムでは、漢字の内部コードが 2 バイトを占めており、漢字処理システムでは中国語と西洋言語の互換性を確保する必要があるため、ASCII コードと漢字の国家標準コードが言語内に存在するとあいまいさが発生します。このためには、漢字の内部コードを適切に処理して国家標準コードに変換する必要があります。

漢字の内部コードを保存するには数バイトが必要です

#この記事の動作環境: Windows10 システム、Thinkpad t480 コンピューター。

漢字の内部コードを保存するには何バイト必要ですか?

漢字の内部コードを保存するには 2 バイトが必要です。

私の国の国家標準局は、1981 年 5 月に、コード名 GB2312-80 の「情報交換用中国語コード化文字セット - 基本セット」を公布しました。このセットには、合計 6763 個の漢字と、 682 個のグラフィック文字。エンコードが実行されます。エンコードの原則は次のとおりです: 中国語の文字は 2 バイトで表されます。

原理的には、2 バイトで 256×256=65536 個の異なる記号を表すことができ、これは中国語の文字エンコード表現の基礎として実現可能です。しかし、中国語の文字エンコーディングと、ASCII 西欧文字エンコーディングなどの他の国際ユニバーサル エンコーディングとの関係を考慮して、我が国の国家標準局は、2 バイトの下位 7 ビットのみを使用する、修正された 2 バイトの中国語文字エンコーディング スキームを採用しました。

このソリューションは 128×128=16384 個の異なる漢字を収容できますが、標準の ASCII コードと互換性を持たせるために、コード値が 32 の 32 個の制御機能コードとスペースは使用できなくなりました。各バイトで使用されるオペコード 127。したがって、1 バイトあたり 94 個のエンコーディングしか存在できません。このように、2 桁の 7 桁で表現できる実際の単語数は、94×94=8836 となります。

漢字の内部コードを保存するには数バイトが必要です

関連記事をさらに読むには、PHP 中国語 Web サイト にアクセスしてください。 !

以上が漢字の内部コードを保存するには数バイトが必要ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。