PHP 中文字符串截取无乱码的方法以及php汉字截取函数_preg_split()
昨天,在写代码时我遇到了一个中文字符串截取的问题,原本是想直接用substr()来,但这个是在单字节符下用的,对于多字节编码的汉字或是其它语言字符中,这个函数可能就用不上了,而且会容易截出乱码来!
问题时间:2013-10-31
解决思路:把汉字按一个汉字在编码下按其在完整性正则分割成数组,再根据需要取截取长度;
1、实现方法函数
<?phpheader ('content-Type:text/html:charset=utf-8');function substr_chinese($str, $start, $length = null) {return join("",array_slice(preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length));} (PS:^_^不错的php学习交流群:276167802,验证:csl,谢谢!)//实例$str = "中国地图全图";echo substr_utf8($str, 0, 4);//输出: 中国地图?>
如果设定了本标记,如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。注意这改变了返回的数组的值,使其中的每个单元也是一个数组,其中第一项为匹配字符串,第二项为其在 subject 中的偏移量。本标记自 PHP 4.3.0 起可用。
<?php $a=array(0=>"Dog",1=>"Cat",2=>"Horse",3=>"Bird");print_r(array_slice($a,1,2));?>输出:Array ( [0] => Cat [1] => Horse )