ホームページ >バックエンド開発 >PHPチュートリアル >漢字変換の種類と解決策について_PHP チュートリアル
●簡体字・繁体字変換には4つのケースがあります
漢字変換は内部コード変換と簡体字・繁体字変換に分かれます。
内部コード変換は簡体字と繁体字間の変換ですが、主にGBコードとBIG5コード間の変換です。
簡体字中国語と繁体字中国語の間の別の種類の変換は、GB コード内での変換です。 GB コード拡張セットには 20,000 を超える中国語が含まれており、当然、簡体字中国語から繁体字中国語への変換の問題も発生します。たとえば、本土のネットユーザーは BIG5 繁体字中国語 Web ページから「コピー&ペースト」方法を使用して繁体字中国語ファイルを取得しますが、それはもはや BIG5 フォントではありません。ページの内部コードは BIG5 コードですが、コピーして貼り付けると、「ノートブック」に貼り付けると、繁体字の GB 内部コードになります。大陸の簡体字型 Windows のノートブックでは文字化けしません。システムは BIG5 コードを認識できません。この繁体字を簡体字に変換したい場合、通常の方法ではできません。
したがって、繁体字中国語文字がすべて BIG5 コードであるとは考えないでください。したがって、漢字変換は次の 4 つの状況に分けられます。
1. GBからBIG5へ
2. BIG5からGB
3.簡体字を繁体字に変換(GBK大陸コードで変換)
4.繁体字を簡体字に変換(同上)
●Webページ「名前を付けて保存」の変換機能。 Web ページの「名前を付けて保存」を使用して、漢字の内部コードを変換します。
「名前を付けて保存」方法を使用して BIG5 Web ページを保存する場合、「Web ページを保存」ウィンドウの下部に「エンコーディング」列があり、少なくとも 3 つのオプションがあることに注意してください: Unicode (UTF-8)、繁体字中国語 (BIG5)、簡体字中国語 (GB2312)。
このWebページの内部コードはUnicode(UTF-8)なので、GBコードとBIG5コードの漢字を同時に表示できます。別の内部コードを選択して保存した場合、内部コード変換はすでに実行されています。この機能を利用して、Web ページの「名前を付けて保存」を使用して、漢字の内部コードを変換できます。
●オンライン漢字変換、主に内部コード変換。コピーしたGBコードの繁体字を同じ内部コードの簡体字に、あるいはその逆に変換したい場合、オンライン変換機能では明らかに不十分です。
●「Kingsoft Quick Translation」には、KConvert.exe と Cjktab32.dll の 2 つのファイルが含まれており、合計サイズはわずか 484K、RAR ファイルに圧縮するとわずか 235K になります。直接抽出して単独で使用することもできます。彼は上記の 4 つの漢字のあらゆる変換を実行できます。
これら 2 つのファイルを Kingsoft Express からアップロードしました。使用したいネチズンはダウンロードできます。
Kingsoft Quick Translationの内部コード変換(解凍可能、インストール不要)
■http://202.202.4.200/upload/upfile/gb-big5.rar■
●個々の文字を手動で修正
ただし、ほとんどの漢字は変換ソフトウェア 簡体字中国語から繁体字中国語に自動的に変換する際、一部の文字の変換に問題があります (1 対多の問題) 姓の Fan がモデル
に変換されます。