>  기사  >  백엔드 개발  >  emoji - php界iconv编码疑云!

emoji - php界iconv编码疑云!

WBOY
WBOY원래의
2016-06-06 20:28:571371검색

输入 ?

<code>$str=json_encode($str);
$str=preg_replace('#(\\\ud[0-9a-f]{3}|\\\u2(6|7)[0-9a-f]{2})#ie','addslashes("\\1")',$str);
$str=json_decode($str);</code>

输出 \ud83d\udc38

那么 问题来了!!!

\ud83d\udc38 应该经过怎样的处理得到 🐸下面是我写的处理,但是不能输出我想要的数值,iconv("UCS-2","UTF-8",pack("H4","\\1")) 不起作用有时得到乱码。

<code>$str=preg_replace('#(\\\u[0-9a-f]{4}\\\u[0-9a-f]{4})#ie','iconv("UCS-2","UTF-8",pack("H4","\\1"))',$str);</code>

更改mysql的数据类型这个方案不能考虑


我完整的需求是这样的:

1、我输入一段话 例如 “一二三四五上山打老虎?”,我在保存进mysql时,需要将?转换成能写进mysql的编码,但是“一二三四五上山打老虎”这部分我需要原文存进数据库,这里就需要对输入的文本进行的正则过滤,然后将?转码,其他正常符号中英文不转码。

2、从数据库输出数据时,我用正则匹配出?的转码,将其输出为?和(🐸0x1f438),因为我在前端显示的静态的图片表示?,图片的来源于twitter的emoji库,图片的名称就是以1f438命名的。

完整的需求就是这样的。求大神指点下。

回复内容:

输入 ?

<code>$str=json_encode($str);
$str=preg_replace('#(\\\ud[0-9a-f]{3}|\\\u2(6|7)[0-9a-f]{2})#ie','addslashes("\\1")',$str);
$str=json_decode($str);</code>

输出 \ud83d\udc38

那么 问题来了!!!

\ud83d\udc38 应该经过怎样的处理得到 🐸下面是我写的处理,但是不能输出我想要的数值,iconv("UCS-2","UTF-8",pack("H4","\\1")) 不起作用有时得到乱码。

<code>$str=preg_replace('#(\\\u[0-9a-f]{4}\\\u[0-9a-f]{4})#ie','iconv("UCS-2","UTF-8",pack("H4","\\1"))',$str);</code>

更改mysql的数据类型这个方案不能考虑


我完整的需求是这样的:

1、我输入一段话 例如 “一二三四五上山打老虎?”,我在保存进mysql时,需要将?转换成能写进mysql的编码,但是“一二三四五上山打老虎”这部分我需要原文存进数据库,这里就需要对输入的文本进行的正则过滤,然后将?转码,其他正常符号中英文不转码。

2、从数据库输出数据时,我用正则匹配出?的转码,将其输出为?和(🐸0x1f438),因为我在前端显示的静态的图片表示?,图片的来源于twitter的emoji库,图片的名称就是以1f438命名的。

完整的需求就是这样的。求大神指点下。

? 的unicode 是 0x1f438,无法用两字节的 UCS-2 编码,用 UCS-4 可以。

大概是这么个思路:

<code><?php function uniord($u) {
    $k = mb_convert_encoding($u, 'UCS-4LE', 'UTF-8');
    $k1 = ord(substr($k, 0, 1));
    $k2 = ord(substr($k, 1, 1));
    $k3 = ord(substr($k, 2, 1));
    return $k3 * 256 * 256 + $k2 * 256 + $k1;
}
echo uniord('?');</code></code>

用mb,

iconv纯属扯淡

在线等 哼哼

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.