-
- header('Content-type:text/html;charset=utf-8');
- /**
- * 中国語の文字列の長さをカウントする関数
- * @param $str 長さを計算する文字列
- * @param $type 計算の長さのタイプ、0 (デフォルト) は 1 つの中国語文字を 1 文字としてカウントすることを意味し、1 は 1 つの中国語文字を意味します文字は 2 文字としてカウントされます
- * @http://bbs.it-home.org
- *
- */
- function abslength($str)
- {
- if( empty($str)){
- return 0;
- }
- if(function_exists('mb_strlen')){
- return mb_strlen($str,'utf-8');
- }
- else {
- preg_match_all("/./ u", $str, $ar);
- return count($ar[0]);
- }
- }
- $str = 'スクリプト アカデミーは皆さんを歓迎します! ';
- $len = abslength($str);
- var_dump($len); //return 12
- $len = abslength($str,'1');
- echo '
'.$len ; //中国語の文字列をインターセプトするための 22
- /*
- utf-8 エンコーディングを返します。パラメーターは substr 関数を参照できます
- @param $str インターセプトされる文字列
- @param $start インターセプトされる開始位置、負の数値インターセプトする長さ
- @param $end インターセプトする長さ
- */
- function utf8_substr($str,$start=0) {
- if(empty($str)){
- return false;
- }
- if (function_exists (' mb_substr')){
- if(func_num_args() >= 3) {
- $end = func_get_arg(2);
- return mb_substr($str,$start,$end,'utf-8');
- }
- else {
- mb_internal_encoding("UTF-8");
- return mb_substr($str,$start);
- }
- }
- else {
- $null = "";
- preg_match_all("/./u", $str , $ ar);
- if(func_num_args() >= 3) {
- $end = func_get_arg(2);
- return join($null, array_slice($ar[0],$start,$end));
- }
- else {
- return join($null, array_slice($ar[0],$start));
- }
- }
- }
- $str2 = '中文を傍受したい';
- echo '
echo utf8_substr($str2,0,-4); //zhon をインターセプトしますか?>
-
コードをコピーします
2 gb2312、gbk、utf-8、big5 中国語インターセプトをサポートします。方法
- /*
- * 中国語インターセプト、gb2312、gbk、utf-8、big5 をサポート
- * bbs.it-home.org
- * @param string $str インターセプトされる文字列
- * @param int $start インターセプト開始位置
- * @param int $length インターセプト長
- * @param string $charset utf-8|gb2312|gbk|big5 エンコード
- * @param $suffix サフィックスを追加するかどうか
- */
- public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
- {
- if(function_exists("mb_substr"))
- {
- if(mb_strlen($str) , $charset) <= $length) return $str;
- $slice = mb_substr($str, $start, $length, $charset);
- }
- else
- {
- $re['utf-8'] = "/[x01-x7f]|[xc2-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}/";
- $re['gb2312'] = "/[x01-x7f]|[xb0-xf7][xa0-xfe]/";
- $re['gbk'] = "/[x01-x7f]|[x81-xfe] ][x40-xfe]/";
- $re['big5'] = "/[x01-x7f]|[x81-xfe]([x40-x7e]|xa1-xfe])/";
- preg_match_all($ re[$charset], $str, $match);
- if(count($match[0]) <= $length) return $str;
- $slice = join("",array_slice($match[0]) , $start, $length));
- }
- if($suffix) return $slice."…";
- return $slice;
- }
- ?>
-
コードをコピー
|