首頁  >  文章  >  後端開發  >  php substr函數截取中文亂碼怎麼辦

php substr函數截取中文亂碼怎麼辦

藏色散人
藏色散人原創
2021-09-20 10:47:363314瀏覽

php substr函數截取中文出現亂碼是因為substr函數會把一個UTF-8的中文字元當做3個位元組來處理,其解決亂碼的方法就是更換使用mb_strlen和mb_substr函數即可。

php substr函數截取中文亂碼怎麼辦

本文操作環境:Windows7系統、PHP7.1、Dell G3電腦。

php substr函數截取中文亂碼怎麼辦?

PHP中substr截取中文亂碼解決方案

#在PHP中經常使用substr來進行字串的截取,但是當我們用它來實現對中文字元進行截取的時候則會發生亂碼問題,比如說:

<?php
$mystring="今天天气真好";
$mysubstring=substr($mystring,0,2);
echo $mysubstring;
?>

輸出結果為�;

原因分析:substr函數原型為:string substr ( string $string , int $ start [, int $length ] ),其中$length表示返回字節長度,而一個中文佔兩個字節,對於一個UTF-8的中文字符,會把它當做3個字節來處理。

<?php
$length=strlen($mystring);echo $length;//输出结果为18
?>

也就是說我們可以用令$length為3,這樣就會成功回傳一個「今」字。這樣的話如果中文和英文混雜的話則需要我們好好地計算一下$length了。

那麼有更好的解決辦法嗎? Php給了另外的函數mb_strlen和mb_substr

<?php
$length=mb_strlen($mystring);
$mysub=mb_substr($mystring,0,4);
echo "the length is:$length,","the substr is:$mysub";
?>

輸出結果為:the length is:6,the substr is:今天天氣
mb_strlen函數原型為int mb_strlen(string string_input, string encode); encode預設為UTF-8,它會將為UTF-8編碼的中文字元算作一個

#注意:mb_strlen與mb_substr並不是PHP的核心函數,使用前需要打開php.ini中的extension=php_mbstring.dll這一項

推薦學習:《PHP影片教學

以上是php substr函數截取中文亂碼怎麼辦的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn