>  기사  >  백엔드 개발  >  求汉语言,英文utf8下统一的计数和截取方法

求汉语言,英文utf8下统一的计数和截取方法

WBOY
WBOY원래의
2016-06-13 12:15:571241검색

求中文,英文utf8下统一的计数和截取方法
做网页,一行只有37个英文字符大小的地方,要判断是不是长了,不是就全显示,是就截取到17个中文字符或34个英文字符长的位置再加上三个点“...”做省略号,因为不能判断用户到时候用哪个国家的文字(没准还用俄语),所以需要一个统一的算法,不知道哪位大侠有办法,谢谢。
------解决思路----------------------
ThinkPHP框架中有一个截取函数比较不错

/**<br /> +----------------------------------------------------------<br /> * 字符串截取,支持中文和其他编码<br /> +----------------------------------------------------------<br /> * @static<br /> * @access public<br /> +----------------------------------------------------------<br /> * @param string $str 需要转换的字符串<br /> * @param string $start 开始位置<br /> * @param string $length 截取长度<br /> * @param string $charset 编码格式<br /> * @param string $suffix 截断显示字符<br /> +----------------------------------------------------------<br /> * @return string<br /> +----------------------------------------------------------<br /> */<br />function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)<br />{<br />    if(function_exists("mb_substr"))<br />	{<br />		if ($suffix && strlen($str)>$length)<br />			return mb_substr($str, $start, $length, $charset)."...";<br />        else<br />			return mb_substr($str, $start, $length, $charset);<br />    }<br />    elseif(function_exists('iconv_substr'))<br />	{<br />		if ($suffix && strlen($str)>$length)<br />			return iconv_substr($str,$start,$length,$charset)."...";<br />        else<br />			return iconv_substr($str,$start,$length,$charset);<br />    }<br /><br />    $re['utf-8']   = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xc2-\xdf][\x80-\xbf]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xe0-\xef][\x80-\xbf]{2}<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xf0-\xff][\x80-\xbf]{3}/";<br />    $re['gb2312'] = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xb0-\xf7][\xa0-\xfe]/";<br />    $re['gbk']    = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\x81-\xfe][\x40-\xfe]/";<br />    $re['big5']   = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\x81-\xfe]([\x40-\x7e]<br><font color='#FF8000'>------解决思路----------------------</font><br>\xa1-\xfe])/";<br />    preg_match_all($re[$charset], $str, $match);<br />    $slice = join("",array_slice($match[0], $start, $length));<br />    if($suffix)<br />		return $slice."…";<br />    return $slice;<br />}

------解决思路----------------------
在浏览器中,一个汉字占两个西文字符的位置,这个说法是针对等宽字体而言的
在此前提下针对 utf-8 编码的中西文混合字符串的显示宽度(西文为1、中文为2)有如下计算公式
(按字节计的长度 - 按字计的长度) / 2 + 按字计的长度

比如 aa中国
按字节计的长度为 8
按字计的长度为 4
带入得 (8-4)/2+4 = 6
即 6 个显示单位

如果你需要先指定显示长度,就需要做循环试探了


其实 css 已经提供了更好的解决方案
<style><br />body{<br />  background-color:#f4f4f4;<br />  font-size:12px;<br />}<br />div.test{<br />  width:200px;<br />  height:60px;<br />  border:1px solid red;<br />  border-top:4px solid red;<br />  padding:10px;<br />  overflow:hidden;<br />  text-overflow:ellipsis;<br />  white-space:nowrap;<br />}<br /></style><br /><div class="test">DIV+CSS模板、后台模板、图片图标下载,CSS代码实例、CSS导航菜单、CSS图表<br /></div><br />

------解决思路----------------------
 text-overflow:ellipsis; 貌似IE only.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.