首頁 >後端開發 >PHP問題 >php中文截取無亂碼函數

php中文截取無亂碼函數

(*-*)浩
(*-*)浩原創
2019-09-07 09:43:393860瀏覽

php中文截取無亂碼函數

在PHP中經常使用substr來進行字串的截取,但是當我們用它來實現對中文字元進行截取的時候則會發生亂碼問題,比如說:

<?php
$mystring="今天天气真好";
$mysubstring=substr($mystring,0,2);
echo $mysubstring;
?>

輸出結果為�;(推薦學習:PHP程式設計從入門到精通

原因分析:substr函數原型為:string substr ( string $string , int $ start [, int $length ] ),其中$length表示返回字節長度,而一個中文佔兩個字節,對於一個UTF-8的中文字符,會把它當做3個字節來處理。

<?php
$length=strlen($mystring);echo $length;//输出结果为18
?>

就是說我們可以用令$length為3,這樣就會成功回傳一個「今」字。這樣的話如果中文和英文混雜的話則需要我們好好地計算一下$length了。

那麼有更好的解決辦法嗎? Php給了另外的函數mb_strlen和mb_substr

<?php
$length=mb_strlen($mystring);
$mysub=mb_substr($mystring,0,4);
echo "the length is:$length,","the substr is:$mysub";
?>

#輸出結果為:the length is:6,the substr is:今天天氣

mb_strlen函數原型為int mb_strlen(string string_input, string encode);encode預設為UTF-8,它會將為UTF-8編碼的中文字元算作一個

注意: mb_strlen與mb_substr並不是PHP的核心函數,使用前需要開啟php.ini中的extension=php_mbstring.dll這項

以上是php中文截取無亂碼函數的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn