ホームページ >よくある問題 >漢字情報は通常どのような形式でコンピュータに保存されますか?

漢字情報は通常どのような形式でコンピュータに保存されますか?

青灯夜游
青灯夜游オリジナル
2021-01-26 14:34:1821153ブラウズ

漢字情報は通常、内部コードの形でコンピュータに保存されます。漢字内部コード (「漢字 ASCII コード」とも呼ばれる) は、「内部コード」とも呼ばれ、コンピュータの内部記憶、漢字の処理、送信に使用される 0 と 1 の記号で構成されるコードを指します。

漢字情報は通常どのような形式でコンピュータに保存されますか?

このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。

漢字情報は通常、内部コードの形でコンピュータに保存されます。

入力コードは受け付けられると、キーボードの入力方法に関係なく、漢字オペレーティングシステムの「入力コード変換モジュール」によって内部コードに変換されます。機械内コードは、漢字の最も基本的なエンコードです。どのような漢字体系や漢字入力方法であっても、入力された漢字の外部コードは、機械内部で機械内コードに変換される必要があります。さまざまな方法で保存および処理されます。

詳細説明

漢字処理システムは中国語と西洋言語間の互換性を確保する必要があるため、ASCII コードと漢字の国家標準コードがシステム内に存在する場合、あいまいさが発生します。システム。 。たとえば、コンテンツ 30H と 21H の 2 バイトがあり、これは漢字「あ」の国家標準コードとスペイン語の「0」と「!」の ASCII コードを表すことができます。このため、漢字のマシン内コードを適切に処理して国家標準コードに変換する必要があります。

国家標準コードの内部コードは2バイト長のコードであり、対応する国家標準コードの各バイトの最上位ビットに「1」を加算したもの、つまり

漢字内部コード = 漢字国家標準コード 8080H

たとえば、上記の文字「あ」の国家標準コードは 3021H であり、その漢字内部コードは B0A1H です。

漢字機械内コードの基礎は、漢字国家標準コードです。

マシン内コード: ASCII コードと国家標準コードが同時に使用される場合のあいまいさの問題を避けるために、ほとんどの漢字システムでは、国家標準コードの各バイトの上位 1 を文字コードとして使用します。漢字の内部コード。これにより、漢字の機械内コードと西洋の機械内コードの間のあいまいさが解決されるだけでなく、漢字の機械内コードと国家標準コードの対応関係が非常に単純になります。

漢字の内部コード、国家標準コード、および場所コードの関係は次のとおりです。場所コード (10 進数) の 2 バイトが 16 進数に変換され、2020H が追加されて、対応する国家標準が取得されます。コード; 内部コードは、漢字交換コード (国家標準コード) の 2 バイトの最上位ビットにそれぞれ 1 を加えたもの、つまり、漢字交換コード (国家標準コード) の 2 バイトに 80H を追加したものです。対応する内部コードを取得; エリアコード(10進数) 2バイトを16進数に変換し、A0Hを加算して対応する内部コードを取得します。

さらに関連記事を読みたい場合は、PHP 中国語 Web サイト にアクセスしてください。 !

以上が漢字情報は通常どのような形式でコンピュータに保存されますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。