ホームページ  >  記事  >  コンピュータ内での保存や交換処理に使用される中国語の文字コードは何ですか?

コンピュータ内での保存や交換処理に使用される中国語の文字コードは何ですか?

藏色散人
藏色散人オリジナル
2020-03-24 14:02:5419486ブラウズ

コンピュータ内での保存や交換処理に使用される中国語の文字コードは何ですか?

コンピューター内での保存や交換処理に使用される中国語の文字エンコードは何ですか?

コンピュータ内部の記憶および交換処理に使用される中国語の文字コードは、内部コードです。

漢字内部コード (「中国語文字 ASCII コード」とも呼ばれる) は、「内部コード」と呼ばれ、コンピュータの内部記憶、処理、送信に使用される 0 と 1 の記号で構成されるコードを指します。漢字。入力コードは受け付けられると、キーボードの入力方法に関係なく、漢字オペレーティングシステムの「入力コード変換モジュール」によって内部コードに変換されます。機械内コードは、漢字の最も基本的なエンコードです。どのような漢字体系や漢字入力方法であっても、入力された漢字の外部コードは、機械内部で機械内コードに変換される必要があります。さまざまな方法で保存および処理されます。

詳しい説明

漢字処理システムでは中国語と欧文の互換性を確保する必要があるため、システム内にASCIIコードと漢字国家標準コードが同時に存在すると、あいまいさが生じます。起こる。たとえば、コンテンツ 30H と 21H の 2 バイトがあり、これは漢字「あ」の国家標準コードとスペイン語の「0」と「!」の ASCII コードを表すことができます。このため、漢字のマシン内コードを適切に処理して国家標準コードに変換する必要があります。

国家標準コードの内部コードは2バイト長のコードであり、対応する国家標準コードの各バイトの最上位ビットに「1」を加算したもの、つまり

漢字内部コード = 漢字国家標準コード 8080H

たとえば、上記の文字「あ」の国家標準コードは 3021H であり、その漢字内部コードは B0A1H です。

漢字機械内コードの基礎は、漢字国家標準コードです。

マシン内コード: ASCII コードと国家標準コードが同時に使用される場合のあいまいさの問題を避けるために、ほとんどの漢字システムでは、国家標準コードの各バイトの上位 1 を文字コードとして使用します。漢字の内部コード。これにより、漢字の機械内コードと西洋の機械内コードの間のあいまいさが解決されるだけでなく、漢字の機械内コードと国家標準コードの対応関係が非常に単純になります。

漢字の内部コード、国家標準コード、および場所コードの関係は次のとおりです。場所コード (10 進数) の 2 バイトが 16 進数に変換され、2020H が追加されて、対応する国家標準が取得されます。コード; 内部コードは、漢字交換コード (国家標準コード) の 2 バイトの最上位ビットにそれぞれ 1 を加えたもの、つまり、漢字交換コード (国家標準コード) の 2 バイトに 80H を追加したものです。対応する内部コードを取得; エリアコード(10進数) 2バイトを16進数に変換し、A0Hを加算して対応する内部コードを取得します。

以上がコンピュータ内での保存や交換処理に使用される中国語の文字コードは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。