搜尋
首頁後端開發php教程php 中文字符串截取有关问题?

php 中文字符串截取问题???
因为用substr()函数截取中文字符串会出现问题,所以我就上网找了一个函数,如下:

PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->//中文字符串截取无乱码函数function cut_str($string, $start, $length) {   if(strlen($string)>$length){      $str = null;      $len = $start+$length;      for($i=$start;$i0xa0){           $str.=substr($string,$i,2);           $i++;        }else{            $str.=substr($string,$i,1);          }   }        return $str.'...';   }else{        return $string;   }}    

但是用过之后还是会出现问题,比如我截取的是“利用滤镜及图层样式制作逼真的石块字”,
PHP code
<!--Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->$str = "利用滤镜及图层样式制作逼真的石块字";cut_str($str,0,50);


但是效果出来了却是这样的:“利用滤镜及图层样式制作逼真的石块?...”,除了个问号一样的字符,我郁闷啊,上网查了一下,汉子在utf-8编码中一般占3个字节,但是这个函数中这里“$str.=substr($string,$i,2);”却截取2,这是什么意思呢??始终没有弄明啊。。。。如果我把2改成3后,那句就会变成“利?甔?滻??镜?及?图?山??样?弼??制?佽??逼?眜?的?石?坝?字...”,唉,,,真的被它搞败了,哪位大侠救救我啊。。。。。。。。。

------解决方案--------------------
怎么不用mb_substr()函数
------解决方案--------------------
你要确定你的编码。截取时指定编码。
------解决方案--------------------
它是以字节计算的。gbk编码。一个中文等于2个字节。
------解决方案--------------------
当然是mb_substr了,楼主对编码看样不太懂。。。

utf8中文编码2-3个字符很常见,但非ASCII字符的单字节一定是第7位为1的,与ASCII单字节是不冲突的,GBK码也是类似的。

请用mb_substr,它会自动根据utf8编码范围识别多字节字符的。
------解决方案--------------------
这个函数只适用于gbk编码

探讨

哈哈,研究了下手册,刚搞定,就是你说的,确定一下编码,但是我想知道那个函数为啥不行啊??那个貌似是php面试的答案诶。前辈能否指点一二,特别是那里的2,utf-8中汉子明明是3-4个字符啊,而且常用的是3个字符啊。。。。。麻烦了

------解决方案--------------------
PHP code
/**************************** * subCNchar() 截取汉字 * * [$str]     [要截取的字符串] * [$start]   [截取的起始位置] * [$length]  [要截取的长度] * [$charset] [字符串编码] ****************************/function subCNchar($str, $start = 0, $length, $charset = "utf-8") {    if (strlen($str) <font color="#e78608">------解决方案--------------------</font><br>为什么不能在后面加上.....<br>echo mb_strlen($str,'utf-8')>10 ? mb_substr($str,0,10,'utf-8').'...' : $str;<br><font color="#e78608">------解决方案--------------------</font><br>加"..."见12楼,  <br><br>如果你非要改这个函数,utf8的编码很有规律,就是下面几种,除ascii码部分外,<br>第一个字节都是11开头,连续的1的个数代表了总字节数,后续字节都是10开头<br>其中汉字基本在3个字节的区.  <br>知道了这个规律,写个函数应该很容易吧?<br>U+007F	   0xxxxxxx<br>U+07FF	   110xxxxx 10xxxxxx<br>U+FFFF	   1110xxxx 10xxxxxx 10xxxxxx<br>U+1FFFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx<br>U+3FFFFFF  111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx<br>U+7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx<br><br><br><br>
探讨

那这个函数能不能改成utf-8的??mb_substr()貌似不能在未输出完的字符结尾加上“...”诶,这样影响效果,求解

------解决方案--------------------
你可以用mb_strimwidth函数
陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
使用java的String.valueOf()函数将基本数据类型转换为字符串使用java的String.valueOf()函数将基本数据类型转换为字符串Jul 24, 2023 pm 07:55 PM

使用Java的String.valueOf()函数将基本数据类型转换为字符串在Java开发中,当我们需要将基本数据类型转换为字符串时,一种常见的方法是使用String类的valueOf()函数。这个函数可以接受基本数据类型的参数,并返回对应的字符串表示。在本文中,我们将探讨如何使用String.valueOf()函数进行基本数据类型转换,并提供一些代码示例来

怎么把char数组转string怎么把char数组转stringJun 09, 2023 am 10:04 AM

char数组转string的方法:可以通过赋值来实现,使用{char a[]=" abc d\0efg ";string s=a;}语法,让char数组对string直接赋值,执行代码即可完成转换。

使用java的String.replace()函数替换字符串中的字符(串)使用java的String.replace()函数替换字符串中的字符(串)Jul 25, 2023 pm 05:16 PM

使用Java的String.replace()函数替换字符串中的字符(串)在Java中,字符串是不可变的对象,这意味着一旦创建了一个字符串对象,就无法修改它的值。但是,你可能会遇到需要替换字符串中的某些字符或者字符串的情况。这时候,我们可以使用Java的String类中的replace()方法来实现字符串的替换。String类的replace()方法有两种重

使用java的String.length()函数获取字符串的长度使用java的String.length()函数获取字符串的长度Jul 25, 2023 am 09:09 AM

使用Java的String.length()函数获取字符串的长度在Java编程中,字符串是一种非常常见的数据类型,我们经常需要获取字符串的长度,即字符串中字符的个数。在Java中,我们可以使用String类的length()函数来获取字符串的长度。下面是一个简单的示例代码:publicclassStringLengthExample{publ

java的String类如何使用java的String类如何使用Apr 19, 2023 pm 01:19 PM

一、认识String1.JDK中的String首先我们看看JDK中的String类源码,它实现了很多接口,可以看到String类被final修饰了,这就说明String类不可以被继承,String不存在子类,这样所有使用JDK的人,用到的String类都是同一个,如果String允许被继承,每个人都可以对String进行扩展,每个人使用的String都不是同一个版本,两个不同的人使用相同的方法,表现出不同的结果,这就导致代码没办法进行开发了继承和方法覆写在带来灵活性的同时,也会带来很多子类行为不

Java String中的split方法如何使用Java String中的split方法如何使用May 02, 2023 am 09:37 AM

String中split方法使用String的split()方法用于按传入的字符或字符串对String进行拆分,返回拆分之后的数组。1、一般用法用一般的字符,例如@或,等符号做分隔符时:Stringaddress="上海@上海市@闵行区@吴中路";String[]splitAddr=address.split("@");System.out.println(splitAddr[0]+splitAddr[1]+splitAddr[2]+splitAddr[3

Golang函数的byte、rune和string类型转换技巧Golang函数的byte、rune和string类型转换技巧May 17, 2023 am 08:21 AM

在Golang编程中,byte、rune和string类型是非常基础、常见的数据类型。它们在处理字符串、文件流等数据操作时发挥着重要作用。而在进行这些数据操作时,我们通常需要对它们进行相互的转换,这就需要掌握一些转换技巧。本文将介绍Golang函数的byte、rune和string类型转换技巧,旨在帮助读者更好地理解这些数据类型,并能够熟练地在编程实践中应用

使用java的String.toLowerCase()函数将字符串转换为小写使用java的String.toLowerCase()函数将字符串转换为小写Jul 24, 2023 pm 11:52 PM

String.toLowerCase()函数是Java中一个非常有用且常见的字符串处理函数,它可以将一个字符串转换为小写形式。在本文中,我们将介绍该函数的使用方法,并给出一些相关的代码示例。首先,让我们来看一下String.toLowerCase()函数的基本语法。它没有任何参数,只需要调用它即可。下面是示例代码:Stringstr=&quot;Hel

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),