Heim  >  Artikel  >  Backend-Entwicklung  >  php分割GBK中文乱码的解决方法

php分割GBK中文乱码的解决方法

WBOY
WBOYOriginal
2016-07-25 09:00:111081Durchsuche
php在分割gbk编码格式的中文字符串时,容易出现乱码,应该如何解决这个问题呢?需要的朋友,参考下本文中的介绍吧。

类似如下的字符串(GBK), explode不能得到正确结果: $result = explode("|", "滕华弢|海青");

究其原因, 对于”弢”字(读tao,不认识没关系,我也不认识), 因为他的GBK编码值为: 8f7c, 不巧的是, “|”的ASCII值也是7c.

还有一些类似的问题: 因为GBK编码的编码范围是: 0×8140-0xfefe, 所以, 理论上来说, 任何低字节是7c的字都会有这个问题, 比如: 倈(827c), 億(837c), 眧(b17c), 鍇(e57c).......等等等等

对于这样的情况, 第一, 可以采用转码到utf8, 然后explode, 再转回来, 这是比较麻烦的方法. 第二, 我们可以采用正则拿"匹配出"来代替"分离出": preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//写死编码 这样, $matches中0号索引对应的数组就是结果词的数组了..

以上就是有关php GBK编码问题的解决方法,不知是否可以解决您的问题,欢迎与大家沟通交流。



Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn