首頁 >後端開發 >php教程 >mysql - 如何用PHP匹配并替换iOS标准的emoji表情符号

mysql - 如何用PHP匹配并替换iOS标准的emoji表情符号

WBOY
WBOY原創
2016-06-06 20:52:131418瀏覽

遇到一个问题,要储存iOS键盘输出的emoji表情到MySQL,我知道用blob+utf8是可以存的。但是现在我的这张表已经太大了,不可能去改类型。所以就想把emoji表情匹配出来,替换掉,再存。
但是,iOS键盘输入的emoji表情,并不是标准的0xe001 - 0xe537这种,而是变化过的。
例如:第一个大笑的表情,标准emoji unicode是 0xe415 而iOS键盘输出的是 0xd83dxde04 两位。
我用preg_match() 去做匹配

preg_match('/\\x{d83d}\\x{de04}/', $str_with_emoji_emotion, $matches);
var_dump($matches);

打印出来是个 NULL

求助各位大神,怎么才能匹配这种表情符号啊。。。

补充:我用 preg_match('/[\x{0000}-\x{FFFF}]/u', $str_with_emoji_emotion, $matches); 去匹配都匹配不到。。。我怀疑是这个表情符号的问题,继续研究。。。继续求解。。。

补充2:今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

回复内容:

遇到一个问题,要储存iOS键盘输出的emoji表情到MySQL,我知道用blob+utf8是可以存的。但是现在我的这张表已经太大了,不可能去改类型。所以就想把emoji表情匹配出来,替换掉,再存。
但是,iOS键盘输入的emoji表情,并不是标准的0xe001 - 0xe537这种,而是变化过的。
例如:第一个大笑的表情,标准emoji unicode是 0xe415 而iOS键盘输出的是 0xd83dxde04 两位。
我用preg_match() 去做匹配

preg_match('/\\x{d83d}\\x{de04}/', $str_with_emoji_emotion, $matches);
var_dump($matches);

打印出来是个 NULL

求助各位大神,怎么才能匹配这种表情符号啊。。。

补充:我用 preg_match('/[\x{0000}-\x{FFFF}]/u', $str_with_emoji_emotion, $matches); 去匹配都匹配不到。。。我怀疑是这个表情符号的问题,继续研究。。。继续求解。。。

补充2:今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

试试这个

preg_match('/\x{d83d}\x{de04}/u', $str_with_smail_emotion, $matches);

其实已经有个开源转换程序了。
http://code.iamcal.com/php/emoji/
https://github.com/iamcal/php-emoji

希望这个能帮到你。
http://stackoverflow.com/questions/12807176/php-writing-a-simple-removeemoji-function#

参考这篇文章 http://www.bubuko.com/infodetail-1022211.html
里边推导了一个公式,可以把 0xd83d0xde04 转成 1f604 ,而 U+1F604 就是 Unified 编码的笑脸表情代码。
文中是 js 的函数,我提取出来了关键几行代码,转成 PHP 代码如下:

$h = 0xd83d; //高位
$l = 0xde04; //低位
$code = ($h - 0xD800) * 0x400 + 0x10000 + $l - 0xDC00; // 转换算法
echo "U+" . strtoupper(dechex($code));
//echo 结果是 U+1F604

另外不同编码方式的转换,@seeyoup 已经说了

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn