Heim > Artikel > Backend-Entwicklung > (Praktischer) Funktionscode zum Berechnen der Länge chinesischer Zeichenfolgen und zum Abfangen chinesischer Zeichenfolgen in PHP
Wir alle wissen, dass es in PHP spezielle Funktionen mb_substr und mb_strlen gibt, die die Länge von Chinesisch abfangen und berechnen können. Da diese Funktionen jedoch nicht die Kernfunktionen von PHP sind, sind sie möglicherweise nicht aktiviert. Wenn Sie Ihren eigenen Server verwenden, müssen Sie diesen natürlich nur in der php.ini aktivieren. Wenn ein virtueller Host verwendet wird und der Server diese Funktion nicht aktiviert, müssen wir einige für uns geeignete Funktionen schreiben.
Die folgenden Funktionen sind recht einfach zu bedienen. Sie müssen jedoch wissen, dass es in einer UTF-8-Umgebung verwendet werden muss.
header('Content-type:text/html;charset=utf-8'); /** * 可以统计中文字符串长度的函数 * @param $str 要计算长度的字符串 * @param $type 计算长度类型,0(默认)表示一个中文算一个字符,1表示一个中文算两个字符 * */ function abslength($str) { if(empty($str)){ return 0; } if(function_exists('mb_strlen')){ return mb_strlen($str,'utf-8'); } else { preg_match_all("/./u", $str, $ar); return count($ar[0]); } } $str = '我们都是中国人啊,ye!'; $len = abslength($str); var_dump($len); //return 12 $len = abslength($str,'1'); echo '<br />'.$len; //return 22 /* utf-8编码下截取中文字符串,参数可以参照substr函数 @param $str 要进行截取的字符串 @param $start 要进行截取的开始位置,负数为反向截取 @param $end 要进行截取的长度 */ function utf8_substr($str,$start=0) { if(empty($str)){ return false; } if (function_exists('mb_substr')){ if(func_num_args() >= 3) { $end = func_get_arg(2); return mb_substr($str,$start,$end,'utf-8'); } else { mb_internal_encoding("UTF-8"); return mb_substr($str,$start); } } else { $null = ""; preg_match_all("/./u", $str, $ar); if(func_num_args() >= 3) { $end = func_get_arg(2); return join($null, array_slice($ar[0],$start,$end)); } else { return join($null, array_slice($ar[0],$start)); } } } $str2 = 'wo要截取zhongwen'; echo '<br />'; echo utf8_substr($str2,0,-4); //return wo要截取zhon
Unterstützt die chinesische Abfangmethode gb2312, gbk, utf-8, big5
<?php /* * 中文截取,支持gb2312,gbk,utf-8,big5 * * @param string $str 要截取的字串 * @param int $start 截取起始位置 * @param int $length 截取长度 * @param string $charset utf-8|gb2312|gbk|big5 编码 * @param $suffix 是否加尾缀 */ public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true) { if(function_exists("mb_substr")) { if(mb_strlen($str, $charset) <= $length) return $str; $slice = mb_substr($str, $start, $length, $charset); } else { $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/"; $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/"; $re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/"; $re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/"; preg_match_all($re[$charset], $str, $match); if(count($match[0]) <= $length) return $str; $slice = join("",array_slice($match[0], $start, $length)); } if($suffix) return $slice."…"; return $slice; }
Der obige (praktische Artikel) beschreibt, wie die Länge chinesischer Zeichenfolgen berechnet und chinesische Zeichenfolgen abgefangen werden in PHP Der Inhalt des Funktionscodes. Weitere verwandte Inhalte finden Sie auf der chinesischen PHP-Website (www.php.cn)!