首頁  >  文章  >  後端開發  >  PHP 開發中涉及emoji表情的幾種處理方法

PHP 開發中涉及emoji表情的幾種處理方法

藏色散人
藏色散人轉載
2019-09-27 09:40:323653瀏覽

最近幾個月做微信開發比較多,存儲微信暱稱必不可少

可這萬惡的微信支持emoji表情做暱稱,這就有點蛋疼了

一般Mysql表設計時,都是用UTF8字符集的。把有emoji的暱稱欄位往裡面insert一下就沒了,整個欄位變成了空字串。這是怎麼回事呢?

原來是因為Mysql的utf8字元集是3位元組的,而emoji是4位元組,這樣整個暱稱就無法儲存了。這該怎麼辦呢?我來介紹幾個方法

1、使用utf8mb4字元集

#如果你的mysql版本>=5.5.3,你大可直接將utf8直接升級為utf8mb4字元集

這種4位元組的utf8編碼可完美相容舊的3位元組utf8字元集,並且可以直接儲存emoji表情,是最好的解決方案

#至於位元組增大帶來的效能損耗,我看過一些評測,幾乎是可以忽略不計的

2、使用base64編碼

如果你因為某些原因無法使用utf8mb4的話,你還可以使用base64來曲線救國

使用例如base64_encode之類的函數編碼過後的emoji可以直接儲存在utf8位元組集的資料表中,取出時decode一下即可

3、幹掉emoji表情

emoji表情是個麻煩的東西,即使你能存儲,也不一定能完美顯示。在iOS以外的平台上,例如PC或android。如果你需要顯示emoji,就得準備一大堆emoji圖片並使用第三方前端類別庫才行。即便如此,還是可能因為emoji圖片不夠全而出現無法顯示的情況

在大多數業務場景下,emoji也不是非要不可的。我們可以適當地考慮幹掉它,節省各種成本

經過一番苦苦的google,終於找到可靠的程式碼:

// 过滤掉emoji表情
function filterEmoji($str)
{
    $str = preg_replace_callback(
            '/./u',
            function (array $match) {
                return strlen($match[0]) >= 4 ? '' : $match[0];
            },
            $str);
     return $str;
 }

基本思想就是遍歷字串中的每個字符,如果該字符的長度為4個字節,就將其刪除。

以上是PHP 開發中涉及emoji表情的幾種處理方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:pein0119。如有侵權,請聯絡admin@php.cn刪除