コンピュータ内の漢字は、マシン内コードを使用して保存されています。漢字のマシン内コードとは、コンピュータの内部記憶、漢字の処理、送信に使用される 0 と 1 の記号で構成されるコードを指します。コードは漢字の最も基本的なものであり、コーディングでは、漢字体系や漢字入力方式に関係なく、入力された漢字の外部コードを機械内部で内部コードに変換してから格納し、さまざまな方法で処理する必要があります。
#この記事の動作環境: Windows 7 システム、Dell G3 コンピューター。
コンピューター内の漢字は、内部コードを使用して保存されます。
中国語の内部コード (「中国語の文字 ASCII コード」とも呼ばれ、「内部コード」とも呼ばれます) は、コンピューターの内部ストレージ、中国語の文字の処理、送信を指します。コードは 0 と 1 のシンボルで構成されます。入力コードは受け付けられると、キーボードの入力方法に関係なく、漢字オペレーティングシステムの「入力コード変換モジュール」によって内部コードに変換されます。機械内コードは、漢字の最も基本的なエンコードです。どのような漢字体系や漢字入力方法であっても、入力された漢字の外部コードは、機械内部で機械内コードに変換される必要があります。さまざまな方法で保存および処理されます。
詳細説明
漢字処理システムは中国語と西洋言語間の互換性を確保する必要があるため、ASCII コードと漢字の国家標準コードがシステム内に存在する場合、あいまいさが発生します。システム。 。たとえば、コンテンツ 30H と 21H の 2 バイトがあり、これは漢字「あ」の国家標準コードとスペイン語の「0」と「!」の ASCII コードを表すことができます。このため、漢字のマシン内コードを適切に処理して国家標準コードに変換する必要があります。
国家標準コードの内部コードは2バイト長のコードであり、対応する国家標準コードの各バイトの最上位ビットに「1」を加算したもの、つまり
漢字内部コード = 漢字国家標準コード 8080H
たとえば、上記の文字「あ」の国家標準コードは 3021H であり、その漢字内部コードは B0A1H です。
漢字機械内コードの基礎は、漢字国家標準コードです。
マシン内コード: ASCII コードと国家標準コードが同時に使用される場合のあいまいさの問題を避けるために、ほとんどの漢字システムでは、国家標準コードの各バイトの上位 1 を文字コードとして使用します。漢字の内部コード。これにより、漢字の機械内コードと西洋の機械内コードの間のあいまいさが解決されるだけでなく、漢字の機械内コードと国家標準コードの対応関係が非常に単純になります。
漢字の内部コード、国家標準コード、および位置コードの関係は次のとおりです。位置コード (10 進数) の 2 バイトが 16 進数に変換され、2020H が追加されて、対応する国家標準が取得されます。コード; 内部コードは、漢字交換コード (国家標準コード) の 2 バイトの最上位ビットにそれぞれ 1 を加えたもの、つまり、漢字交換コード (国家標準コード) の 2 バイトに 80H を追加したものです。対応する内部コードを取得; エリアコード(10進数) 2バイトを16進数に変換し、A0Hを加算して対応する内部コードを取得します。
関連する推奨事項: 「プログラミング入門」
以上がコンピューターに漢字を保存するには何が使用されますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。