한자를 가로채기 위해 PHP 함수 substr을 직접 사용하면 문자가 깨질 수 있습니다. 주된 이유는 substr이 한자를 강제로 반으로 "볼" 수 있기 때문입니다. 그럼 이 문제를 해결하는 방법을 살펴보겠습니다.
모든 사람이 자신의 프로그램에서 문자열 가로채기를 자주 사용하지만 중국어 문자열을 가로챌 때 문자가 왜곡되는 문제에 자주 직면한다고 믿습니다. 매우 번거로운 일입니다. 다음으로 중국어 문자열을 가로챌 때 문자 깨짐을 방지하는 두 가지 방법을 소개하겠습니다.
첫 번째는 사용하기 쉽도록 함수를 직접 작성하는 것입니다.
이 함수를 사용하여 가로채면 문자가 깨지는 일이 없습니다.
/** * 支持中文字符串截取 */ function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){ switch($charset){ case 'utf-8':$char_len=3;break; case 'UTF8':$char_len=3;break; default:$char_len=2; } //小于指定长度,直接返回 if(strlen($str)<=($length*$char_len)){ return $str; } if(function_exists("mb_substr")){ $slice= mb_substr($str, $start, $length, $charset); }else if(function_exists('iconv_substr')){ $slice=iconv_substr($str,$start,$length,$charset); }else{ $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/"; $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/"; $re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/"; $re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/"; preg_match_all($re[$charset], $str, $match); $slice = join("",array_slice($match[0], $start, $length)); } if($suffix) return $slice; return $slice; }
두 번째는 PHP에 내장된 함수인 mb_substr 함수
가로채기할 문자열의 인코딩 형식을 지정하여 잘못된 문자를 효과적으로 방지할 수 있습니다.
Explanation
string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] ) <?php function substr_unicode($str, $s, $l = null) { return join("", array_slice( preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $s, $l)); } $str = "Büyük"; $s = 0; // start from "0" (nth) char $l = 3; // get "3" chars echo substr($str, $s, $l) ."\n"; echo mb_substr($str, $s, $l) ."\n"; echo substr_unicode($str, $s, $l); ?>
Summary: 위 내용은 이 글의 전체 내용입니다. 모든 분들의 공부에 도움이 되었으면 좋겠습니다.
관련 추천:
PHP WeChat 인터페이스는 QR 코드 생성 클래스를 구현합니다
위 내용은 문자 깨짐을 방지하기 위해 PHP에서 한자를 가로채는 방법을 간략하게 설명합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!