在PHP中經常使用substr來進行字串的截取,但是當我們用它來實現對中文字元進行截取的時候則會發生亂碼問題 ,比如說:(推薦學習:PHP程式設計從入門到精通)
<?php $mystring="今天天气真好"; $mysubstring=substr($mystring,0,2); echo $mysubstring; ?>
#輸出結果為�;
原因分析:substr函數原型為:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字節長度,而一個中文佔兩個字節,對於一個UTF-8的中文字符,會把它當做3個位元組來處理。
<?php $length=strlen($mystring);echo $length;//输出结果为18 ?>
也就是說我們可以用令$length為3,這樣就會成功回傳一個「今」字。這樣的話如果中文和英文混雜的話則需要我們好好地計算一下$length了。
那麼有更好的解決辦法嗎?
Php給了另外的函數mb_strlen和mb_substr
<?php $length=mb_strlen($mystring); $mysub=mb_substr($mystring,0,4); echo "the length is:$length,","the substr is:$mysub"; ?>
輸出結果為:the length is:6,the substr is:今天天氣
mb_strlen函數原型為int mb_strlen(string string_input, string encode);encode預設為UTF-8,它會將為UTF-8編碼的中文字元算作一個
注意: mb_strlen與mb_substr並不是PHP的核心函數,使用前需要開啟php.ini中的extension=php_mbstring.dll這項
以上是php實作中文字串截取無亂碼的詳細內容。更多資訊請關注PHP中文網其他相關文章!