Maison  >  Article  >  base de données  >  Comment interroger le codage de caractères dans mysql5.5 ?

Comment interroger le codage de caractères dans mysql5.5 ?

青灯夜游
青灯夜游original
2020-10-16 10:22:392409parcourir

Dans mysql5.5, vous pouvez interroger l'encodage des caractères via l'instruction "SHOW VARIABLES LIKE 'character%';" qui peut afficher le jeu de caractères utilisé par le client MySQL, le jeu de caractères utilisé lors de la connexion à la base de données et créer une base de données Le jeu de caractères utilisé, le jeu de caractères utilisé par le système de base de données, etc.

Comment interroger le codage de caractères dans mysql5.5 ?

(Tutoriel recommandé : Tutoriel vidéo MySQL)

Le personnage (Caractère) est constitué de lettres, de chiffres et de symboles dans ordinateurs Terme général désignant un caractère, un caractère peut être un caractère chinois, une lettre anglaise, un chiffre arabe, un signe de ponctuation, etc.

Les ordinateurs stockent les données sous forme binaire. Les chiffres, l'anglais, les signes de ponctuation, les caractères chinois et autres caractères que nous voyons habituellement à l'écran sont le résultat d'une conversion de nombres binaires.

Le jeu de caractères définit la correspondance entre les caractères et le binaire et attribue des numéros uniques aux caractères. Les jeux de caractères courants incluent ASCII, GBK, IOS-8859-1, etc.

L'encodage des caractères (Encodage des caractères) peut également être appelé code de jeu de caractères, qui spécifie comment stocker les numéros de caractères dans l'ordinateur.

La plupart des jeux de caractères ne correspondent qu'à un seul encodage de caractères, tels que : ASCII, IOS-8859-1, GB2312, GBK, qui représentent tous à la fois le jeu de caractères et l'encodage de caractères correspondant. Donc en général, les deux peuvent être considérés comme synonymes. L'exception est le jeu de caractères Unicode, qui comporte trois schémas de codage, UTF-8, UTF-16 et UTF-32. Le codage le plus couramment utilisé est UTF-8.

Dans MySQL, vous pouvez utiliser la commande SHOW VARIABLES LIKE 'character%'; pour afficher le jeu de caractères actuellement utilisé par MySQL. La commande et les résultats d'exécution sont les suivants :

mysql> SHOW VARIABLES LIKE 'character%';
+--------------------------+---------------------------------------------------------+
| Variable_name            | Value                                                   |
+--------------------------+---------------------------------------------------------+
| character_set_client     | gbk                                                     |
| character_set_connection | gbk                                                     |
| character_set_database   | latin1                                                  |
| character_set_filesystem | binary                                                  |
| character_set_results    | gbk                                                     |
| character_set_server     | latin1                                                  |
| character_set_system     | utf8                                                    |
| character_sets_dir       | C:\Program Files\MySQL\MySQL Server 5.7\share\charsets\ |
+--------------------------+---------------------------------------------------------+
8 rows in set, 1 warning (0.01 sec)

Les résultats d'exécution ci-dessus. sont décrits dans le tableau suivant :

名称 说明
character_set_client MySQL 客户端使用的字符集
character_set_connection 连接数据库时使用的字符集
character_set_database 创建数据库使用的字符集
character_set_filesystem MySQL 服务器文件系统使用的字符集,默认值为 binary,不做任何转换
character_set_results 数据库给客户端返回数据时使用的字符集
character_set_server MySQL 服务器使用的字符集,建议由系统自己管理,不要人为定义
character_set_system 数据库系统使用的字符集,默认值为 utf8,不需要设置
character_sets_dir 字符集的安装目录

Lorsque les caractères sont tronqués, vous n'avez pas besoin de vous soucier des trois variables système Character_set_filesystem, Character_set_system et Character_sets_dir, elles n'affecteront pas les caractères tronqués. .

Dans MySQL, le processus de commande et d'exécution pour afficher les jeux de caractères disponibles sont les suivants :

mysql> SHOW CHARACTER set;
+----------+---------------------------------+---------------------+--------+
| Charset  | Description                     | Default collation   | Maxlen |
+----------+---------------------------------+---------------------+--------+
| big5     | Big5 Traditional Chinese        | big5_chinese_ci     |      2 |
| dec8     | DEC West European               | dec8_swedish_ci     |      1 |
| cp850    | DOS West European               | cp850_general_ci    |      1 |
| hp8      | HP West European                | hp8_english_ci      |      1 |
| koi8r    | KOI8-R Relcom Russian           | koi8r_general_ci    |      1 |
| latin1   | cp1252 West European            | latin1_swedish_ci   |      1 |
| latin2   | ISO 8859-2 Central European     | latin2_general_ci   |      1 |
| swe7     | 7bit Swedish                    | swe7_swedish_ci     |      1 |
| ascii    | US ASCII                        | ascii_general_ci    |      1 |
| ujis     | EUC-JP Japanese                 | ujis_japanese_ci    |      3 |
| sjis     | Shift-JIS Japanese              | sjis_japanese_ci    |      2 |
| hebrew   | ISO 8859-8 Hebrew               | hebrew_general_ci   |      1 |
| tis620   | TIS620 Thai                     | tis620_thai_ci      |      1 |
| euckr    | EUC-KR Korean                   | euckr_korean_ci     |      2 |
| koi8u    | KOI8-U Ukrainian                | koi8u_general_ci    |      1 |
| gb2312   | GB2312 Simplified Chinese       | gb2312_chinese_ci   |      2 |
| greek    | ISO 8859-7 Greek                | greek_general_ci    |      1 |
| cp1250   | Windows Central European        | cp1250_general_ci   |      1 |
| gbk      | GBK Simplified Chinese          | gbk_chinese_ci      |      2 |
| latin5   | ISO 8859-9 Turkish              | latin5_turkish_ci   |      1 |
| armscii8 | ARMSCII-8 Armenian              | armscii8_general_ci |      1 |
| utf8     | UTF-8 Unicode                   | utf8_general_ci     |      3 |
| ucs2     | UCS-2 Unicode                   | ucs2_general_ci     |      2 |
| cp866    | DOS Russian                     | cp866_general_ci    |      1 |
| keybcs2  | DOS Kamenicky Czech-Slovak      | keybcs2_general_ci  |      1 |
| macce    | Mac Central European            | macce_general_ci    |      1 |
| macroman | Mac West European               | macroman_general_ci |      1 |
| cp852    | DOS Central European            | cp852_general_ci    |      1 |
| latin7   | ISO 8859-13 Baltic              | latin7_general_ci   |      1 |
| utf8mb4  | UTF-8 Unicode                   | utf8mb4_general_ci  |      4 |
| cp1251   | Windows Cyrillic                | cp1251_general_ci   |      1 |
| utf16    | UTF-16 Unicode                  | utf16_general_ci    |      4 |
| utf16le  | UTF-16LE Unicode                | utf16le_general_ci  |      4 |
| cp1256   | Windows Arabic                  | cp1256_general_ci   |      1 |
| cp1257   | Windows Baltic                  | cp1257_general_ci   |      1 |
| utf32    | UTF-32 Unicode                  | utf32_general_ci    |      4 |
| binary   | Binary pseudo charset           | binary              |      1 |
| geostd8  | GEOSTD8 Georgian                | geostd8_general_ci  |      1 |
| cp932    | SJIS for Windows Japanese       | cp932_japanese_ci   |      2 |
| eucjpms  | UJIS for Windows Japanese       | eucjpms_japanese_ci |      3 |
| gb18030  | China National Standard GB18030 | gb18030_chinese_ci  |      4 |
+----------+---------------------------------+---------------------+--------+
41 rows in set (0.02 sec)

Où :

  • Le premier la colonne (Charset ) est le nom du jeu de caractères

  • La deuxième colonne (Description) est la description du jeu de caractères

  • La troisième colonne ( Classement par défaut) est le caractère Les règles de classement par défaut de l'ensemble

  • La quatrième colonne (Maxlen) indique le nombre maximum d'octets occupés par un caractère dans le jeu de caractères.

Les jeux de caractères couramment utilisés sont les suivants :

  • latin1 prend en charge les caractères d'Europe occidentale, les caractères grecs, etc.

  • gbk prend en charge les caractères chinois simplifiés.

  • big5 prend en charge les caractères chinois traditionnels.

  • utf8 prend en charge les caractères de presque tous les pays.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn