ホームページ >バックエンド開発 >PHPチュートリアル >PHP で中国語と英語の文字を決定する_PHP チュートリアル

PHP で中国語と英語の文字を決定する_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-13 10:54:141007ブラウズ

コーディングテーブル

全角文字エンコード範囲

1.GBK(GB2312/GB18030)
x00-xff gbk 2 バイトエンコード範囲
x20-x7f アスキー
xa1-xff 中国語 gb2312
x80-xff 中国の GBK

2.utf-8 (ユニコード)

u4e00-u9fa5 (中国語)
x3130-x318f (韓国語
) xac00-xd7a3 (韓国語)
u0800-u4e00 (日本語)


$str = "中国";
エコー $str;
echo "
";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //gb2312 の場合のみ使用可能
if (preg_match("/^[x7f-xff]+$/", $str)) { //gb2312、utf-8 と互換性があります
echo "正しく入力してください";
} その他 {
echo "入力が間違っています";
}
?>

実際、中国語の判定問題については多くの知識があり、基礎となる内部エンコーディングには utf-8、gbk、gb13800 のさまざまな違いが関係しています。私はかつて、そのキャラクターがどのようなキャラクターであるかをどのように区別するかという問題を研究したことがあります。関連する詳細が多すぎます。

www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/632325.html技術記事コーディング表 全角文字エンコーディング範囲 1. gbk (gb2312/gb18030) x00-xff gbk 全角エンコーディング範囲 x20-x7f ascii xa1-xff 中国語 gb2312 x80-xff 中国語 gbk 2. utf-8 (unicode) u4e00-u9fa5 ...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。