首頁 >常見問題 >PHP處理字元中的emoji表情(判斷/移除/儲存)

PHP處理字元中的emoji表情(判斷/移除/儲存)

藏色散人
藏色散人轉載
2020-07-08 13:21:224829瀏覽

PHP處理字元中的emoji表情(判斷/移除/儲存)

目錄

  • 判斷字串中是否含有emoji 表情
  • 移除字串中的emoji 表情
  • 含有emoji 表情的字串在MySQL 中的儲存

utf-8 編碼的emoji 表情或某些特殊字元佔用4 個位元組。 utf-8 編碼的常用中文字元佔用 3 個位元組。

判斷字串中是否含有emoji 表情

三個PHP 內建函數:

  • mb_strlen
mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )


// 返回具有 encoding 编码的字符串 str 包含的字符数。 多字节的字符被计为 1。
// 如果给定的 encoding 无效则返回 FALSE。
  • mb_substr
string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )

// 根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str 的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 1。
// mb_substr() 函数根据 start 和 length 参数返回 str 中指定的部分。
  • strlen
int strlen ( string $string )

// 返回给定的字符串 string 的长度。

函數如下:

function haveEmojiChar($str)
{
    $mbLen = mb_strlen($str);
    
    $strArr = [];
    for ($i = 0; $i < $mbLen; $i++) {
        $strArr[] = mb_substr($str, $i, 1, &#39;utf-8&#39;);
        if (strlen($strArr[$i]) >= 4) {
            return true;
        }
    }
    
    return false;
}

移除字串中的emoji表情

函數如下:

function removeEmojiChar($str)
{
    $mbLen = mb_strlen($str);
    
    $strArr = [];
    for ($i = 0; $i < $mbLen; $i++) {
        $mbSubstr = mb_substr($str, $i, 1, &#39;utf-8&#39;);
        if (strlen($mbSubstr) >= 4) {
            continue;
        }
        $strArr[] = $mbSubstr;
    }
    
    return implode(&#39;&#39;, $strArr);
}

含有emoji 表情的字串在MySQL 中的儲存

1、MySQL 中使用utf8mb4 字符集。

2、PHP 對字串進行 base64 編碼,從資料庫中取出時再對字串進行解碼。

3、直接移除字串中的 emoji 表情(該方法簡單粗暴)

以上是PHP處理字元中的emoji表情(判斷/移除/儲存)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:cnblogs.com。如有侵權,請聯絡admin@php.cn刪除