Maison  >  Article  >  base de données  >  MySQL prend en charge le stockage des icônes emoji

MySQL prend en charge le stockage des icônes emoji

藏色散人
藏色散人avant
2019-10-28 14:33:292598parcourir

Lorsque les données UPDATA et INSERT sont utilisées dans MySLQ, si les données comportent des icônes emoji, telles que : ?, ?, ?, il est facile de les mettre à jour ou de les insérer sans succès, ce qui entraîne une erreur.

Error: ER_TRUNCATED_WRONG_VALUE_FOR_FIELD: 
Incorrect string value: '\xF0\x9F\x91\xBD\xF0\x9F...' for column 'name' at row

J'ai failli m'effondrer, mais heureusement, j'ai finalement résolu ce problème étrange. La raison indiquée dans les données est qu'avant MYSQL 5.5, le codage UTF8 ne prenait en charge que 1 à 3 octets et ne prenait en charge que la zone de codage Unicode de la partie BMP, et les icônes emoji étaient stockées dans un codage sur 4 octets. À partir de MYSQL5.5, le codage UTF utf8mb4 sur 4 octets peut être pris en charge. Un caractère peut avoir jusqu'à 4 octets, il peut donc prendre en charge plus de jeux de caractères. Par conséquent, pour résoudre le problème, tous les codages de caractères des tables de base de données doivent être modifiés en utf8mb4.

Recommandé : Tutoriel vidéo MySQL

Jeux de caractères courants

ASCII : American Standard Encoding for Information Interchange ; Langues d'Europe occidentale ; codage sur un seul octet, 7 bits représentant un caractère, 128 caractères au total.

GBK : spécification d'extension de code interne de caractères chinois sur deux octets ; caractères chinois, japonais et coréens, anglais, chiffres ; un total de 21 003 caractères chinois sont inclus, une extension de GB2312.

UTF-8 : codage de caractères à longueur variable standard Unicode ; norme Unicode (Unicode), une norme unifiée dans l'industrie, comprenant des dizaines de systèmes de texte dans le monde ;

UTF-8 : Utilisez un à trois octets pour coder chaque caractère.

utf8mb4 : stocke quatre octets. Le scénario d'application est utilisé pour stocker les expressions emoji car les expressions emoji peuvent faire quatre octets.

utf8mb4 : version MySQL > 5.5.3.

Autres jeux de caractères courants : UTF-32, UTF-16, Big5, latin1

Le jeu de caractères dans la base de données contient deux niveaux de signification

Une collection de textes variés et symboles, y compris les caractères, signes de ponctuation, symboles graphiques, chiffres, etc. de chaque pays.

La méthode d'encodage des caractères, c'est-à-dire les règles de mappage entre les données binaires et les caractères.

Environnement système

MySQL 5.7.14

Mac OSX 10.11.6

Sauvegarde d'abord

Sauvegardez toutes les données sur votre serveur avant de mettre à niveau les données, maintenez de bonnes habitudes, la sécurité avant tout !

Mettez à niveau votre MySQL

La nouvelle base de données peut être téléchargée iciMettez à niveau le serveur MySQL vers la v5.5.3+.

Modifiez votre base de données, vos tables, vos champs

# 对每一个数据库:
ALTER DATABASE 这里数据库名字 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
# 对每一个表:
ALTER TABLE 这里是表名字 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 对每一个字段:
ALTER TABLE 这里是表名字 CHANGE 字段名字 重复字段名字 VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 上面一句或者使用modify来更改
ALTER TABLE 这里是表名字 modify 字段名字 VARCHAR(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci DEFAULT '';

utf8mb4 est entièrement rétrocompatible avec utf8, sans caractères tronqués ou autres formes de perte de données. Théoriquement, vous pouvez le modifier sans souci. Si vous n'êtes pas sûr de le modifier, vous pouvez restaurer les données à partir de la sauvegarde, puis laisser le programmeur gérer le problème de stockage compatible avec les emoji. Lors de l'enregistrement, filtrez-le et convertissez-le en base64. , puis le reconvertir lors de sa récupération ? ... Il est plus pratique de modifier la base de données.

Vérifiez vos champs et index

Ne réglez pas tout sur utf8mb4, c'est nécessaire. Je ne l'ai défini sur utf8mb4 que lorsque certains de mes types de champs sont VARCHAR.

Modifiez le fichier de configuration MySQL

Cet endroit est le plus déroutant. Je ne trouve pas /etc/my.cnf sur mon système Mac OSX. Il n'existe pas du tout, il faut donc créer un tel fichier et le modifier.

# 进入这个目录,
# 在这个目录下面有个后缀为`.cnf`的文件
cd /usr/local/mysql/support-files/
# 将这个文件复制到`etc`目录中并将名字命名为`my.cnf`
sudo cp my-default.cnf /etc/my.cnf
# 然后编辑`my.cnf`文件,将下面内容复制到里面。
sudo vim /etc/my.cnf

Fichier de configuration MySQL (/etc/my.cnf) :

[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci

Redémarrer MySQL

L'étape de redémarrage est très importante, sinon elle n'aura aucun effet.

Démarrer : /usr/local/mysql/support-files/mysql.server start

Arrêter : /usr/local/mysql/support-files/mysql.server stop

Redémarrer :/usr/local/mysql/support-files/mysql.server restart

Le système peut redémarrer, s'arrêter ou démarrer sous cette forme

service mysqld stop
service mysqld start
service mysqld restart

Vérifiez s'il est set Success

Utilisez la commande suivante pour vérifier si le réglage est réussi !

# 登陆MySQL进行查询
mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';
# 运行上面代码显示下面结果
# +--------------------------+--------------------+
# | Variable_name            | Value              |
# +--------------------------+--------------------+
# | character_set_client     | utf8mb4            |
# | character_set_connection | utf8mb4            |
# | character_set_database   | utf8mb4            |
# | character_set_filesystem | binary             |
# | character_set_results    | utf8mb4            |
# | character_set_server     | utf8mb4            |
# | character_set_system     | utf8               |
# | collation_connection     | utf8mb4_unicode_ci |
# | collation_database       | utf8mb4_unicode_ci |
# | collation_server         | utf8mb4_unicode_ci |
# +--------------------------+--------------------+
# 查看表的情况
mysql>  SHOW FULL COLUMNS  FROM  users_profile;

À ce stade, cela signifie que vous avez réussi ! Félicitations! ~

Réparer et optimiser la table

J'ai atteint ce point et il n'est pas nécessaire de réparer et d'optimiser la table Pour être prudent, je continue. a exécuté ces deux commandes. Bien que je ne sache pas quel est son objectif, je vais le mettre ici et prendre note.

REPAIR TABLE 表名字;
OPTIMIZE TABLE 表名字;

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer