Home  >  Article  >  Backend Development  >  求汉语言,英文utf8下统一的计数和截取方法

求汉语言,英文utf8下统一的计数和截取方法

WBOY
WBOYOriginal
2016-06-13 12:15:571202browse

求中文,英文utf8下统一的计数和截取方法
做网页,一行只有37个英文字符大小的地方,要判断是不是长了,不是就全显示,是就截取到17个中文字符或34个英文字符长的位置再加上三个点“...”做省略号,因为不能判断用户到时候用哪个国家的文字(没准还用俄语),所以需要一个统一的算法,不知道哪位大侠有办法,谢谢。
------解决思路----------------------
ThinkPHP框架中有一个截取函数比较不错

/**<br /> +----------------------------------------------------------<br /> * 字符串截取,支持中文和其他编码<br /> +----------------------------------------------------------<br /> * @static<br /> * @access public<br /> +----------------------------------------------------------<br /> * @param string $str 需要转换的字符串<br /> * @param string $start 开始位置<br /> * @param string $length 截取长度<br /> * @param string $charset 编码格式<br /> * @param string $suffix 截断显示字符<br /> +----------------------------------------------------------<br /> * @return string<br /> +----------------------------------------------------------<br /> */<br />function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)<br />{<br />    if(function_exists("mb_substr"))<br />	{<br />		if ($suffix && strlen($str)>$length)<br />			return mb_substr($str, $start, $length, $charset)."...";<br />        else<br />			return mb_substr($str, $start, $length, $charset);<br />    }<br />    elseif(function_exists('iconv_substr'))<br />	{<br />		if ($suffix && strlen($str)>$length)<br />			return iconv_substr($str,$start,$length,$charset)."...";<br />        else<br />			return iconv_substr($str,$start,$length,$charset);<br />    }<br /><br />    $re['utf-8']   = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xc2-\xdf][\x80-\xbf]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xe0-\xef][\x80-\xbf]{2}<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xf0-\xff][\x80-\xbf]{3}/";<br />    $re['gb2312'] = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\xb0-\xf7][\xa0-\xfe]/";<br />    $re['gbk']    = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\x81-\xfe][\x40-\xfe]/";<br />    $re['big5']   = "/[\x01-\x7f]<br><font color='#FF8000'>------解决思路----------------------</font><br>[\x81-\xfe]([\x40-\x7e]<br><font color='#FF8000'>------解决思路----------------------</font><br>\xa1-\xfe])/";<br />    preg_match_all($re[$charset], $str, $match);<br />    $slice = join("",array_slice($match[0], $start, $length));<br />    if($suffix)<br />		return $slice."…";<br />    return $slice;<br />}

------解决思路----------------------
在浏览器中,一个汉字占两个西文字符的位置,这个说法是针对等宽字体而言的
在此前提下针对 utf-8 编码的中西文混合字符串的显示宽度(西文为1、中文为2)有如下计算公式
(按字节计的长度 - 按字计的长度) / 2 + 按字计的长度

比如 aa中国
按字节计的长度为 8
按字计的长度为 4
带入得 (8-4)/2+4 = 6
即 6 个显示单位

如果你需要先指定显示长度,就需要做循环试探了


其实 css 已经提供了更好的解决方案
<style><br />body{<br />  background-color:#f4f4f4;<br />  font-size:12px;<br />}<br />div.test{<br />  width:200px;<br />  height:60px;<br />  border:1px solid red;<br />  border-top:4px solid red;<br />  padding:10px;<br />  overflow:hidden;<br />  text-overflow:ellipsis;<br />  white-space:nowrap;<br />}<br /></style><br /><div class="test">DIV+CSS模板、后台模板、图片图标下载,CSS代码实例、CSS导航菜单、CSS图表<br /></div><br />

------解决思路----------------------
 text-overflow:ellipsis; 貌似IE only.

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn