首頁  >  文章  >  後端開發  >  PHP字串長度計算 - strlen()函數使用介紹

PHP字串長度計算 - strlen()函數使用介紹

高洛峰
高洛峰原創
2017-01-05 11:45:341819瀏覽

strlen()函數和mb_strlen()函數 

在PHP中,函數strlen()傳回字串的長度。函數原型如下: 

int strlen(string string_input);

參數string_input為要處理的字串。 

strlen()函數傳回字串所佔的位元組長度,一個英文字母、數字、各種符號都佔一個位元組,它們的長度均為1。一個中午字元佔兩個位元組,所以一個中午字元的長度是2。例如 

<?php 
echo strlen("www.php.cn"); 
echo strlen("PHP中文网"); 
?>

“echo strlen("www.php.cn");”的運行結果:15 

“echo strlen("PHP中文網");”的運行結果:15 

這裡有一個PHP中文網");”的運行結果:15 

這裡有一個PHP中文網");”的運行結果:15 

這裡有一個PHP中文網");中文字元不是佔2個位元組嗎? “三知開發網”,明明是五個漢字,運行的結果怎麼會是15? 

原因出在這裡:strlen()計算時,對於一個UTF-8的中文字符,會把它當做長度為3來處理。當出現中英文混排的情況下,怎麼準確的計算字串的長度呢?這裡,得再引入一個函數mb_strlen()。 mb_strlen()函數的用法與strlen()幾乎一摸一樣,只是多了一個指定字元集編碼的參數。函數原型為: 

int mb_strlen(string string_input, string encode);

PHP內建的字串長度函數strlen無法正確處理中文字串,它得到的只是字串所佔的位元組數。對於GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對於UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個漢字佔3個位元組)。 因此,以下的程式碼能精確計算出中文字串的長度: 
<?php 
$str = "三知sunchis开发网"; 
echo strlen($str)."<br>"; //结果:22 
echo mb_strlen($str,"UTF8")."<br>"; //结果:12 
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2; 
echo $strlen; //结果:17 
?>

原理分析: 

strlen()計算時,對待UTF-8的中文字元長度是3,所以「三知sunchis開發網」的長度為5×3+7×1=22 
在mb_strlen計算時,選取內碼為UTF8,則會將一個中文字元當作長度1來計算,所以「三知sunchis開發網」長度為5×1+ 7×1=12 

剩下的就是純數學問題了,在此就不囉嗦了… 

🎜注意:對於mb_strlen($str,'UTF-8'),如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以透過mb_internal_encoding()函數得到。需要注意的是,mb_strlen並不是PHP核心函數,使用前需要確保在php.ini中載入了php_mbstring.dll,即確保「extension=php_mbstring.dll」這一行存在並且沒有被註解掉,否則會出現未定義函數的問題。 🎜🎜更多PHP字串長度計算 - strlen()函數使用介紹相關文章請關注PHP中文網! 🎜
陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn