Maison >base de données >tutoriel mysql >UTF8mb4 vs utf8 dans MySQL : quel jeu de caractères devriez-vous choisir ?
Explorer les différences : jeux de caractères utf8mb4 et utf8 dans MySQL
MySQL propose une gamme de jeux de caractères, notamment utf8mb4 et utf8. Bien que les deux soient basés sur l'encodage UTF-8, ils diffèrent par leurs capacités.
Encodages UTF-8 : une revue
ASCII : Un encodage 7 bits prenant en charge l'alphabet anglais et commun symboles.
UTF-8 : Un codage de longueur variable qui utilise 1 à 4 octets par point de code.
UTF-16 : A Encodage 16 bits, principalement utilisé dans les systèmes d'exploitation.
UTF-32 : Un encodage 32 bits, rarement utilisé en raison de ses besoins élevés en mémoire.
utf8mb3 et utf8mb4
L'encodage "utf8" de MySQL, également connu sous le nom de "utf8mb3", stocke un maximum de trois octets par point de code. Cet encodage prend en charge le "Basic Multilingual Plane" (BMP), qui couvre la plage de 0x000 à 0xFFFF.
L'encodage "utf8mb4" étend ce principe en prenant en charge quatre octets par point de code. Cette capacité étendue permet le stockage de « caractères supplémentaires » qui ne relèvent pas du BMP, notamment les emoji et certains caractères asiatiques.
Avantages de utf8mb4 par rapport à utf8
En résumé, si vous avez besoin d'un support de personnage au-delà du BMP ou prévoyez de pérennisez votre base de données, "utf8mb4" est le choix optimal.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!