Home >Backend Development >PHP Tutorial >php函数substr、mb_substr、mb_strcut截取中文比较

php函数substr、mb_substr、mb_strcut截取中文比较

WBOY
WBOYOriginal
2016-06-23 13:36:001119browse

一、函数说明
    substr、mb_substr、mb_strcut这三个函数都用来截取字符串,所不同的是:substr是最简单的截取,无法适应中文;mb_substr是按字来切分字符串,而mb_strcut是按字节来切分字符串,截取中文都不会产生半个字符的现象。
    这三个函数的前三个参数完全一致,即:
第一个参数是操作对象
第二个参数是截取的起始位置
第三个参数是截取的数量
    mb_substr和mb_strcut还有第四个参数:第四个参数可以根据不同的字符集进行设置

  

//对待一个UTF8的中文字符是3个长度    

//对待一个gbk的中文字符是2个长度    

header("content-Type:text/html;charset=utf-8");    

    

//设置内部编码    

mb_internal_encoding('UTF-8');    

    

//测试     

$cn_str="钓鱼岛是中国的hehe";    

$en_str="this is just a test";    

    

    

//使用substr    

echo substr($cn_str,0,3).'
'; //钓    

echo substr($en_str,0,3).'

';   //thi    

    

    

//使用mbsubstr()    

echo "mb_substr-3:".mb_substr($cn_str,0,3).'
';   //钓鱼岛    按照字来划分     

echo "substr-3:".substr($cn_str,0,3).'
';//钓   按照字节来划分      

echo "mb_strcut-3:".mb_strcut($cn_str,0,3).'

'; //钓   按照字节来划分    

  

  

echo "mb_substr-4:".mb_substr($cn_str,0,4).'
';   //钓鱼岛    按照字来划分  

echo "substr-4:".substr($cn_str,0,4).'
'; //钓   按照字节来划分(出现乱码)      

echo "mb_strcut-4:".mb_strcut($cn_str,0,4).'

'; //钓   按照字节来划分(不会出现乱码)    

  

  

  

  

echo strlen($cn_str).'
';   //26    

echo mb_strlen($cn_str).'
';  //12    

echo iconv_strlen($cn_str).'
';//26    

  

?>  


三、结论
        substr、mb_strcut表现都不够理想,mb_substr可以正常使用,但前提是要安装php扩展库,否则就要自己写一个适应各种情况的截取函数了。


Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn