<table cellspacing="0" cellpadding="0"><tr><td class="t_f" id="postmessage_15866"> 以前、自分で書いたものを投稿したことを覚えているようです。今日の記事はオンラインにあります。 http://www.cnblogs.com/zcy_soft/archive/2010/12/13/1904791.html <div class="blockcode"> <div id="code_RgC"><ol> <li>/* 中国語を判断するには、実際には多くの知識が必要です。基礎となる内部エンコーディングには、utf-8、gbk、gb13800 のさまざまな違いが関係します。私はかつて、そのキャラクターがどのようなキャラクターであるかをどのように区別するかという問題を研究したことがあります。関連する詳細が多すぎます。 </li> <li> <li>今日は中国語を判別するためのPHPコードを作成しました。漢文判断を勉強している友人の参考になれば幸いです。 */</li> <li><!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"></li> <li><HTML></li> <li><HEAD></li> <li><TITLE> 新しいドキュメント </TITLE></li> <li>< ;META http-equiv="Content-Type" content="text/html; charset=utf-8"></li> <li></HEAD></li> <li><BODY></li> <li><?<li>$str = "中国";<li> echo $str;<li>echo "<hr>";</li> <li>//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str) ) { //GB2312 でのみ使用可能</li> <li>if (preg_match("/^[x7f-xff]+$/", $str)) { //gb2312、utf-8 と互換性あり</li> <li> echo "正しい入力";</li> <li> } else {</li> <li> echo "Wrong input";</li> <li>}</li> <li>?></li> <li></BODY></li> <li></HTML></li> <li>/*</li> <li>エンコーディングテーブル</li> <li>全角文字エンコーディング範囲</li> <li> GBK (GB2312/GB18030) </li> <li>x00-xff GBK 2 バイトエンコード範囲</li> <li>x20-x7f ASCII</li> <li>xa1-xff 中国語 gb2312</li> <li>x80-xff 中国語 gbk</li> <li>2. UTF-8 (Unicode)</li> <li>u4e00-u9fa5 (中国語)</li> <li>x3130-x318F (韓国語</li> <li>) xAC00-xD7A3 (韓国語)</li> <li>u0800-u4e00 (日本語)*/</li> </ol></div> <em onclick="copycode($('code_RgC'));">コードをコピー</em> </div> </td></tr></table> <div id="comment_15866" class="cm"> </div> <div id="post_rate_div_15866"></div> <br><br>