首页 >后端开发 >PHP问题 >PHP字符串学习之如何返回汉字或混合字符的长度

PHP字符串学习之如何返回汉字或混合字符的长度

青灯夜游
青灯夜游原创
2021-08-09 17:28:502190浏览

在之前的文章《PHP怎么将某长度的子串换成*号》中,我们介绍了字符串替换,将某长度的子串换成*号的方法,这次我们继续了解字符串,介绍一下计算中文字符串长度,或者中英文混合字符串长度的方法。

如何计算中文字符串长度?对于这个问题,我们可能第一反应就是使用strlen()函数,但strlen()函数处理全英文字符串还是不错的,但当了中英文混合或纯中文的字符串中,就不行了。我们看看下面的例子:

<?php
header("Content-type:text/html;charset=utf-8");  //设置字符编码为utf-8
$str = "欢迎来到PHP中文网!";
echo &#39;字符串 “&#39;.$str.&#39;” 的长度为:&#39;.strlen($str).&#39;<br>&#39;;
?>

输出结果为:

0.png

可以看出,strlen()函数因为处理字符的规则不同,无法准确的返回中英文混合或纯中文字符串的长度。那么为什么会返回27呢?

那是因为我们采用的字符编码为utf-8,在UTF-8 编码下一个中文字符占三个字节。

strlen()函数在ASCII码下,一个中文汉字占两个字节的空间;在UTF-8编码下,一个中文(含繁体)等于三个字节;在Unicode编码下,一个中文(含繁体)等于两个字节。

而上例中的字符串“欢迎来到PHP中文网!”中一个包含了8个中文字符,3个英文字符,则8*3+3=27个字节,则字符串长度为27。

但这样的字符串长度不是我们想要的,那样如何处理中文字符,可以准确的计算出我们想要的中英文混合或纯中文字符串的长度呢?

PHP提供了一个函数来解决这个问题,那就是mb_strlen() 函数

还是上个示例,这次使用mb_strlen() 函数来计算字符串长度:

<?php
header("Content-type:text/html;charset=utf-8");
$str = "欢迎来到PHP中文网!";
echo &#39;字符串 “&#39;.$str.&#39;” 的长度为:&#39;.mb_strlen($str,&#39;utf-8&#39;).&#39;<br>&#39;;
?>

输出结果为:

1.png

可以看出:字符串$str中,中文+英文+感叹号,一个有11个字符,输出结果也为11。对了,找到对的人了~

mb_strlen() 函数中无论是汉字,还是英文、数字、小数点、下划线和空格,都只占一个字节。

下面我们来简单了解一下mb_strlen() 函数。

mb_strlen($string,$encoding)函数可以通过设置字符编码从而返回对应的字符数;该函数接受一个必需参数$string(需要检测的字符串)和一个可省略的参数$encoding(字符编码),如果省略则使用内部字符编码。

我们可以通过设置对应的$encoding参数,就能很好的处理中文字符串的长度问题。

好了就说到这里了,有其他想知道的,可以点击这个哦。→ →php视频教程

 最后给大家推荐阅读一个经典课程《PHP字符串处理(玉女心经版)》,免费的~快来学习啊!

以上是PHP字符串学习之如何返回汉字或混合字符的长度的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn