首頁  >  文章  >  資料庫  >  MySQL 支援 emoji 圖示存儲

MySQL 支援 emoji 圖示存儲

藏色散人
藏色散人轉載
2019-10-28 14:33:292446瀏覽

在MySLQ中 UPDATA 和 INSERT 資料的時候,如果資料上面有emoji圖標,例如:?、?、? 很容易更新或插入不成功,導致報錯。

Error: ER_TRUNCATED_WRONG_VALUE_FOR_FIELD: 
Incorrect string value: '\xF0\x9F\x91\xBD\xF0\x9F...' for column 'name' at row

都快崩潰了,但還好終於解決了這種鬼問題。資料顯示原因是,MYSQL 5.5 之前, UTF8 編碼只支援1-3個字節,只支援BMP這部分的unicode編碼區,而emoji圖示恰好是4個位元組的編碼進行儲存。從MYSQL5.5開始,可支援4個位元組UTF編碼utf8mb4,一個字元最多能有4位元組,所以能支援更多的字元集。所以要解決問題,必需把資料庫表格字元編碼全部改成utf8mb4。

推薦:mysql影片教學

常用字元集

ASCII:美國資訊互換標準編碼;英文和其他西歐語言;單字節編碼,7位元表示一個字符,共128字符。

GBK:雙字節,漢字內碼擴展規範;中日韓漢字、英文、數字;雙字節編碼;共收錄了21003個漢字,GB2312的擴展。

UTF-8:Unicode標準的可變長度字元編碼;Unicode標準(統一碼),業界統一標準,包括世界上數十種文字的系統;

UTF-8:使用一到三個位元組為每個字元編碼。

utf8mb4:儲存四個字節,應用場景用於儲存emoji表情,因為可以emoji表情四個位元組。

utf8mb4:MySQL版本 > 5.5.3 。

其他常見字元集:UTF-32,UTF-16,Big5,latin1

資料庫中的字元集包含兩層意義

各種文字和符號的集合,包括各國文字、標點符號、圖形符號、數字等。

字元的編碼方式,即二進位資料與字元的對應規則。

系統環境

MySQL 5.7.14

Mac OSX 10.11.6

##首先備份

升級資料之前備份您伺服器上的所有數據,保持良好習慣,安全第一!

升級您的MySQL

新的資料庫可以在這裡下載

Upgrade the MySQL server to v5.5.3

修改您的資料庫、表格、欄位

# 对每一个数据库:
ALTER DATABASE 这里数据库名字 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
# 对每一个表:
ALTER TABLE 这里是表名字 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 对每一个字段:
ALTER TABLE 这里是表名字 CHANGE 字段名字 重复字段名字 VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 上面一句或者使用modify来更改
ALTER TABLE 这里是表名字 modify 字段名字 VARCHAR(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci DEFAULT '';

utf8mb4完全向後相容utf8,無亂碼或其他資料遺失的形式出現。理論上是可以放心修改,如果您不放心修改,您可以拿備份恢復數據,然後讓程式設計師處理這種兼容emoji存儲問題,存的時候過濾一遍轉成base64,然後取的時候轉回來? ... 還是修改資料庫比較方便。

檢查你的欄位和索引

不要將所有的都設定成utf8mb4,這個冒得必要。我只在我某些字段類型為VARCHAR的時候才設置成utf8mb4。

修改MySQL設定檔

這個地方最坑,我在我Mac osx 系統上找不到/etc/my.cnf 它根本不存在,所以我們需要建立這樣一個檔案並修改它。

# 进入这个目录,
# 在这个目录下面有个后缀为`.cnf`的文件
cd /usr/local/mysql/support-files/
# 将这个文件复制到`etc`目录中并将名字命名为`my.cnf`
sudo cp my-default.cnf /etc/my.cnf
# 然后编辑`my.cnf`文件,将下面内容复制到里面。
sudo vim /etc/my.cnf

MySQL configuration file (/etc/my.cnf):

[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci

重啟MySQL

重啟步驟很重要,不然沒有任何效果。

啟動:/usr/local/mysql/support-files/mysql.server start

停止:/usr/local/mysql/support-files/mysql.server stop

#重新啟動:/usr/local/mysql/support-files/mysql.server restart

系統中可以以這種形式重新啟動、停止或啟動

service mysqld stop
service mysqld start
service mysqld restart

#查看是否設定成功

透過下面指令查詢是否設定成功!

# 登陆MySQL进行查询
mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';
# 运行上面代码显示下面结果
# +--------------------------+--------------------+
# | Variable_name            | Value              |
# +--------------------------+--------------------+
# | character_set_client     | utf8mb4            |
# | character_set_connection | utf8mb4            |
# | character_set_database   | utf8mb4            |
# | character_set_filesystem | binary             |
# | character_set_results    | utf8mb4            |
# | character_set_server     | utf8mb4            |
# | character_set_system     | utf8               |
# | collation_connection     | utf8mb4_unicode_ci |
# | collation_database       | utf8mb4_unicode_ci |
# | collation_server         | utf8mb4_unicode_ci |
# +--------------------------+--------------------+
# 查看表的情况
mysql>  SHOW FULL COLUMNS  FROM  users_profile;

到這一步表示你成功了!恭喜你! ~

修復和優化表

我跑到這一步其實沒有任何必要修復和優化表,為了保險起見,我還是運行了這兩條命令,雖然我不知道它有什麼卵用,放在這裡做個筆記吧。

REPAIR TABLE 表名字;
OPTIMIZE TABLE 表名字;

以上是MySQL 支援 emoji 圖示存儲的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:segmentfault.com。如有侵權,請聯絡admin@php.cn刪除