>  기사  >  백엔드 개발  >  PHP mbsubstr의 중국어 왜곡 문제를 해결하는 방법

PHP mbsubstr의 중국어 왜곡 문제를 해결하는 방법

藏色散人
藏色散人원래의
2021-09-01 10:07:042236검색

php mbsubstr 중국어 잘못된 코드에 대한 해결 방법: 1. mbstring 확장 라이브러리의 mb_substr()을 사용하여 가로채기 2. 사용자 정의된 "function sub_str(){...}" 메서드를 통해 잘못된 코드 문제를 해결합니다.

PHP mbsubstr의 중국어 왜곡 문제를 해결하는 방법

이 문서의 운영 환경: Windows 7 시스템, PHP 7.1 버전, Dell G3 컴퓨터

PHP mbsubstr의 중국어 왜곡 문제를 해결하는 방법?

PHP는 substr을 사용하여 문자열을 가로채고 중국어 잘못된 문제가 발생합니다. mb_substr

예제 :mb_substr('Interception of Chinese 잘못된 코드 문제 테스트',0,5, 'utf-8');

语法 : string substr (string string, int start [, int length])
$rest = substr ("abcdef", 1); // returns "bcdef"
$rest = substr ("abcdef", 1, 3); // returns "bcd"

시작이 음수인 경우 반환된 문자열은 문자열 끝에서 문자를 시작합니다.

$rest = substr ("abcdef", -1); // returns "f"
$rest = substr ("abcdef", -2); // returns "ef"
$rest = substr ("abcdef", -3, 1); // returns "d"

매개변수 길이가 지정되고 양수인 경우 반환되는 문자열은 시작부터 길이 문자입니다.

매개변수 길이가 음수인 경우 반환된 문자열은 문자열 끝에서 길이 번째 문자에서 끝납니다.

$rest = substr ("abcdef", 1, -1); // returns "bcde"

영어에는 문제가 없습니다.

$rest = substr ("中国人", 1, -1); // returns "fdsafsda" 就是乱码了

문자를 가로채는 결과는 확실히 우리가 원하는 결과가 아닙니다. 이러한 중국어 왜곡된 PHP substr로 인해 프로그램이 정상적으로 실행되지 않을 수 있습니다.

두 가지 주요 해결 방법이 있습니다.

1. mbstring 확장 라이브러리의 mb_substr()을 사용하여 잘못된 문자가 나타나지 않도록 합니다.

mb_substr()/mb_strcut() 함수를 사용할 수 있습니다. mb_substr()/mb_strcut()의 사용법은 mb_substr()/mb_strcut 끝에 매개변수를 하나 더 추가해야 한다는 점을 제외하면 substr()과 유사합니다. 문자열의 인코딩을 설정하려면

그러나 대부분의 서버는 php_mbstring.dll을 열지 않습니다. php.ini에서 php_mbstring.dll을 열어야 합니다.

echo mb_substr("php中文字符encode",0,4,"utf-8");

마지막 인코딩 매개변수를 지정하지 않으면 3바이트가 한자 1문자로 사용됩니다. 이는 utf-8 문자 집합 설명을 추가하면 의 단위로 가로채게 됩니다. 한 마디.

사용시 php파일의 인코딩과 웹페이지 표시시 인코딩에 주의하세요. 이 mb_substr 메소드를 사용하려면 문자열의 인코딩을 미리 알아야 하며, 인코딩을 모른다면 판단이 필요합니다. mbstring 라이브러리에서는 문자열 인코딩을 확인할 수 있는 mb_check_encoding도 제공하지만 아직 완벽하지는 않습니다. .

PHP에는 여러 문자열 차단 기능이 포함되어 있으며 그 중 substr 및 mb_substr이 일반적으로 사용됩니다. 전자가 중국어를 처리할 때 GBK는 2길이 단위이고, UTF는 3길이 단위이다. 후자는 인코딩을 지정한 후 한자 1자가 1길이 단위가 된다.

substr은 때때로 중국어의 1/3 또는 절반을 잘라내어 문자가 왜곡되어 표시되는 경우가 있습니다. 상대적으로 말하면 mb_substr이 우리가 사용하기에 더 적합합니다. 그러나 때때로 mb_substr은 사용하기 쉽지 않습니다. 예를 들어 작은 그림의 간략한 정보를 표시하고 싶다면 한자는 5자가 딱 맞고, 5자가 넘으면 처음 4자를 가로채서 "..."만 추가하면 됩니다. 중국어이지만 영어나 숫자를 처리할 때 이 차단이 너무 짧습니다.

추천: "PHP Video Tutorial"

둘째, 차단 기능을 직접 작성하지만 mbstring 확장 라이브러리를 사용하는 것만큼 효율성이 높지 않습니다. 다음은 UTF-8로 인코딩된 문자열을 가로채는 ecshop의 함수입니다.

아아아아

위 내용은 PHP mbsubstr의 중국어 왜곡 문제를 해결하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.