ホームページ >バックエンド開発 >PHPチュートリアル >PHP中国語とエンコード判定コード_PHPチュートリアル
エンコード範囲1. GBK(GB2312/GB18030) -u9fa5 (中国語) x3130-x318F (韓国語) xAC00-xD7A3 (韓国語)
u0800-u4e00 (日本語)
ps: 韓国語は [u9fa5] より大きい文字です
通常の例: preg_replace("/([ x80 -xff])/”,””,$str); preg_replace(”/([u4e00-u9fa5])/”,””,$str);
2. コードをコピーします。
コードは次のとおりです:
//コンテンツに中国語が含まれているかどうかを確認します-GBK (PHP)
function check_is_chinese($s){
return preg_match('/[x80-xff]./', $ s);
}
//文字列の長さを取得する - GBK (PHP) function gb_strlen($str){
$count = 0; $i=0; $i
if(preg_match("/[x80-xff]/", substr($str, $i, 1)))
++$count ;
}
return substr($str, 0, $i);
//統計文字列長 - UTF8 (PHP)
function utf8_strlen($str) {
$count = 0; $i = 0; $i < $str);
$value = ord($str[$i]);
$count++; $value > ;= 192 && $value <= 223) $i++;
elseif($value >= 224 && $value else die('UTF-8 互換の文字列ではありません');
$count++
}
//インターセプト文字列 -UTF8(PHP)
function utf8_substr($str,$position,$length){
$start_position = strlen($str);
$end_position = strlen($str); = 0 ;
for($i = 0; $i
$start_position = $i ;
$start_byte = $count;
if(($count-$start_byte)>=$length) {
$end_position = $i;
$value = ord; ]) ;
if($value > 127){
$count++;
if($value >= 192 && $value = 224 && $value < ;= 239) $i = $i + 2;
elseif($value >= 240 && $value else die('UTF-8 互換の文字列ではありません' );
}
$count++;
}
return(substr($str,$start_position,$end_position-$start_position));
}
function checkKoreaChar( str) {
for(i=0; i
}
}
return false
}
//中国語の文字があるかどうかを判断します - GBK (JavaScript) )
function check_chinese_char (s){
return (s.length != s.replace(/[^x00-xff]/g,"**").length);
http://www.bkjia.com/PHPjc/321937.html
www.bkjia.com
本当
http://www.bkjia.com/PHPjc/321937.html
技術記事
コーディング範囲 1. GBK (GB2312/GB18030) x00-xff GBK 2 バイトコーディング範囲 x20-x7f ASCII xa1-xff 中国語 x80-xff 中国語 2. UTF-8 (Unicode) u4e00-u9fa5 (中国語) x3130-x318F (韓国語) ) ...