ホームページ >バックエンド開発 >PHPチュートリアル >PHP は漢字の格子データを読み取り、php は lattice_PHP チュートリアルを読み取ります
プロジェクトで発生した問題:
PHPで漢字の格子データを読み取るには?テキストを入力したい場合は、このテキストのすべてのビットマップ コードを取得できます。
解決策:
簡体字中国語の国家標準フォント ライブラリには、第 1 レベルの中国語 3,755 文字と第 2 レベルの中国語 3,008 文字を含む 6,773 文字を含む 7,445 文字が含まれています。 2 バイト (16 ビット バイナリ) エンコーディングを使用します。
市外局番: 国家標準 GB2312 では、すべての国家標準の漢字と記号が 94×94 のマトリックスを形成することが規定されています。この正方行列では、各行を「エリア」、各列を「ビット」と呼びます。したがって、この正方行列は実際には 94 個のエリア(エリア番号は 0 ~ 1 ~ 94)を構成し、それぞれ 94 個あります。エリア内の漢字セットの数字(桁番号は01~94)。漢字の市外局番と位置番号を単純に組み合わせると、漢字の「位置コード」が形成されます。漢字の市外局番は、上2桁が市外局番、下2桁が位置番号です。位置コードと漢字または記号の間には 1 対 1 の対応関係があることがわかります。
内部コード: 漢字の内部コードは、コンピューターにおける中国語の文字のエンコーディングを指します。マシンコードとロケーションコードの間にはわずかな違いがあります。現在、中国のほとんどのコンピュータ システムでは、漢字の内部コードは 2 バイトを占めており、それぞれ上位バイトおよび下位バイトと呼ばれ、これら 2 バイトと市外局番の関係は次のとおりです。コード上位 = 地域コード + A0H (H は 16 進数を表します) 内コードの下位 = ビットコード + A0H たとえば、漢字「あ」の地域コードは「1601」、地域コードとビットコードをそれぞれ16進数で表現すると「1001H」となり、その内部コードは「B0A1H」となります。このうち、B0H が内部コードの上位バイト、A1H が内部コードの下位バイトです。
0と1から構成される文字列を返します
以上がこの記事の全内容です。皆さんに気に入っていただければ幸いです。