5分鐘讀懂MySQL字元集設置-mysql教程-PHP中文網

首頁

資料庫

mysql教程

5分鐘讀懂MySQL字元集設置

小云云

Jan 11, 2018 pm 01:15 PM

mysql字元集設定

本文主要介紹mysql字符集、字符序的概念與聯繫，並給大家分享了多種方式查看MYSQL支援的字符集。具體內容詳情大家參考下本文，希望能幫助大家。

一、內容概述

在MySQL的使用過程中，了解字元集、字元序列的概念，以及不同設定對資料儲存、比較的影響非常重要。不少同學在日常工作中遇到的「亂碼」問題，很有可能就是因為對字符集與字符序的理解不到位、設定錯誤造成的。

本文由淺入深，分別介紹如下內容：

字元集、字元序的基本概念及聯繫
MySQL支援的字元集、字元序設定級，各設定層級之間的聯繫
server、database、table、column層級字元集、字元序的查看及設定
應該何時設定字元集、字元序

二、字元集、字元序的概念與聯繫

在資料的儲存上，MySQL提供了不同的字元集支援。而在資料的對比操作上，則提供了不同的字元序支援。

MySQL提供了不同層級的設置，包括server級、database級、table級、column級，可以提供非常精確的設定。

什麼是字元集、字元序？簡單的來說：

字元集（character set）：定義了字元以及字元的編碼。
字元序（collation）：定義了字元的比較規則。

舉例：

有四個字元：A、B、a、b，這四個字元的編碼分別是A = 0, B = 1 , a = 2, b = 3。這裡的字元 + 編碼就構成了字元集（character set）。

如果我們想比較兩個字元的大小呢？例如A、B，或a、b，最直覺的比較方式是採用它們的編碼，例如因為0

另外，對於A、a，雖然它們編碼不同，但我們覺得大小寫字元應該是相等的，也就是說 A == a。

這上面定義了兩條比較規則，這些比較規則的集合就是collation。

同樣是大寫字符、小寫字符，則比較他們的編碼大小；
如果兩個字符為大小寫關係，則它們相等。

三、MySQL支援的字元集、字元序列

#MySQL支援多種字元集與字元序列。

一個字元集對應至少一種字元序（一般是1對多）。
兩個不同的字元集不能有相同的字元序列。
每個字元集都有預設的字元序列。

上面說的比較抽象，我們看下後面幾個小節就知道怎麼回事了。

1、查看支援的字元集

可以透過以下方式查看MYSQL支援的字元集。

方式一：

mysql> SHOW CHARACTER SET;
+----------+-----------------------------+---------------------+--------+
| Charset | Description   | Default collation | Maxlen |
+----------+-----------------------------+---------------------+--------+
| big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
| dec8 | DEC West European  | dec8_swedish_ci | 1 |
...省略

方式二：

mysql> use information_schema;
mysql> select * from CHARACTER_SETS;
+--------------------+----------------------+-----------------------------+--------+
| CHARACTER_SET_NAME | DEFAULT_COLLATE_NAME | DESCRIPTION   | MAXLEN |
+--------------------+----------------------+-----------------------------+--------+
| big5  | big5_chinese_ci | Big5 Traditional Chinese | 2 |
| dec8  | dec8_swedish_ci | DEC West European  | 1 |
...省略

使用SHOW CHARACTER SET檢視時，也可以加上WHERE或LIKE限定條件。

範例一：使用WHERE限定條件。

mysql> SHOW CHARACTER SET WHERE Charset="utf8";
+---------+---------------+-------------------+--------+
| Charset | Description | Default collation | Maxlen |
+---------+---------------+-------------------+--------+
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
+---------+---------------+-------------------+--------+
1 row in set (0.00 sec)

範例二：使用LIKE限定條件。

mysql> SHOW CHARACTER SET LIKE "utf8%";
+---------+---------------+--------------------+--------+
| Charset | Description | Default collation | Maxlen |
+---------+---------------+--------------------+--------+
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
+---------+---------------+--------------------+--------+
2 rows in set (0.00 sec)

2、查看支援的字元序

類似的，可以透過以下方式查看MYSQL支援的字元序。

方式一：透過SHOW COLLATION進行檢視。

可以看到，utf8字元集有超過10種字元序。透過Default的值是否為Yes，判斷是否預設的字元序。

mysql> SHOW COLLATION WHERE Charset = 'utf8';
+--------------------------+---------+-----+---------+----------+---------+
| Collation  | Charset | Id | Default | Compiled | Sortlen |
+--------------------------+---------+-----+---------+----------+---------+
| utf8_general_ci  | utf8 | 33 | Yes | Yes | 1 |
| utf8_bin   | utf8 | 83 |  | Yes | 1 |
...略

方式二：查詢information_schema.COLLATIONS。

mysql> USE information_schema;
mysql> SELECT * FROM COLLATIONS WHERE CHARACTER_SET_NAME="utf8";
+--------------------------+--------------------+-----+------------+-------------+---------+
| COLLATION_NAME  | CHARACTER_SET_NAME | ID | IS_DEFAULT | IS_COMPILED | SORTLEN |
+--------------------------+--------------------+-----+------------+-------------+---------+
| utf8_general_ci  | utf8  | 33 | Yes | Yes  | 1 |
| utf8_bin   | utf8  | 83 |  | Yes  | 1 |
| utf8_unicode_ci  | utf8  | 192 |  | Yes  | 8 |

3、字元序的命名規範

字元序的命名，以其對應的字元集作為前綴，如下所示。例如字符序utf8_general_ci，標明它是字符集utf8的字符序。

更多規則可以參考官方文件。

MariaDB [information_schema]> SELECT CHARACTER_SET_NAME, COLLATION_NAME FROM COLLATIONS WHERE CHARACTER_SET_NAME="utf8" limit 2; 
+--------------------+-----------------+
| CHARACTER_SET_NAME | COLLATION_NAME |
+--------------------+-----------------+
| utf8  | utf8_general_ci |
| utf8  | utf8_bin |
+--------------------+-----------------+
2 rows in set (0.00 sec)

四、server的字元集、字元序

用途：當你建立資料庫，且沒有指定字元集、字元序時，server字元集、server字元序就會作為該資料庫的預設字元集、排序規則。

如何指定：MySQL服務啟動時，可透過命令列參數指定。也可以透過設定檔的變數指定。

server預設字元集、字元序：在MySQL編譯的時候，透過編譯參數來指定。

character_set_server、collation_server分別對應server字元集、server字元序。

1、查看server字元集、字元序

分別對應character_set_server、collation_server兩個系統變數。

mysql> SHOW VARIABLES LIKE "character_set_server";
mysql> SHOW VARIABLES LIKE "collation_server";

2、啟動服務時指定

可以在MySQL服務啟動時，指定server字元集、字元序列。如不指定，預設的字元序分別為latin1、latin1_swedish_ci

mysqld --character-set-server=latin1 \
 --collation-server=latin1_swedish_ci

分別指定server字元集，此時，server字元序為latin1的預設字元序latin1_swedish_ci。

mysqld --character-set-server=latin1

3、設定檔指定

除了在命令列參數裡指定，也可以在設定檔裡指定，如下所示。

[client]
default-character-set=utf8
[mysql]
default-character-set=utf8
[mysqld]
collation-server = utf8_unicode_ci
init-connect='SET NAMES utf8'
character-set-server = utf8

4、運行時修改

範例：運行時修改（重啟後會失效，如果想要重開機後保持不變，需要寫進設定檔裡）

mysql> SET character_set_server = utf8 ;

5、编译时指定默认字符集、字符序

character_set_server、collation_server的默认值，可以在MySQL编译时，通过编译选项指定：

cmake . -DDEFAULT_CHARSET=latin1 \
  -DDEFAULT_COLLATION=latin1_german1_ci

五、database的字符集、字符序

用途：指定数据库级别的字符集、字符序。同一个MySQL服务下的数据库，可以分别指定不同的字符集/字符序。

1、设置数据的字符集/字符序

可以在创建、修改数据库的时候，通过CHARACTER SET、COLLATE指定数据库的字符集、排序规则。

创建数据库：

CREATE DATABASE db_name
 [[DEFAULT] CHARACTER SET charset_name]
 [[DEFAULT] COLLATE collation_name]

修改数据库：

ALTER DATABASE db_name
 [[DEFAULT] CHARACTER SET charset_name]
 [[DEFAULT] COLLATE collation_name]

例子：创建数据库test_schema，字符集设置为utf8，此时默认的排序规则为utf8_general_ci。

CREATE DATABASE `test_schema` DEFAULT CHARACTER SET utf8;

2、查看数据库的字符集/字符序

有3种方式可以查看数据库的字符集/字符序。

例子一：查看test_schema的字符集、排序规则。（需要切换默认数据库）

mysql> use test_schema;
Database changed
mysql> SELECT @@character_set_database, @@collation_database;
+--------------------------+----------------------+
| @@character_set_database | @@collation_database |
+--------------------------+----------------------+
| utf8   | utf8_general_ci |
+--------------------------+----------------------+
1 row in set (0.00 sec)

例子二：也可以通过下面命令查看test_schema的字符集、数据库（不需要切换默认数据库）

mysql> SELECT SCHEMA_NAME, DEFAULT_CHARACTER_SET_NAME, DEFAULT_COLLATION_NAME FROM information_schema.SCHEMATA WHERE schema_name="test_schema";
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| test_schema | utf8   | utf8_general_ci |
+-------------+----------------------------+------------------------+
1 row in set (0.00 sec)

例子三：也可以通过查看创建数据库的语句，来查看字符集。

mysql> SHOW CREATE DATABASE test_schema;
+-------------+----------------------------------------------------------------------+
| Database | Create Database       |
+-------------+----------------------------------------------------------------------+
| test_schema | CREATE DATABASE `test_schema` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+-------------+----------------------------------------------------------------------+
1 row in set (0.00 sec)

3、database字符集、字符序是怎么确定的

创建数据库时，指定了CHARACTER SET或COLLATE，则以对应的字符集、排序规则为准。
创建数据库时，如果没有指定字符集、排序规则，则以character_set_server、collation_server为准。

六、table的字符集、字符序

创建表、修改表的语法如下，可通过CHARACTER SET、COLLATE设置字符集、字符序。

CREATE TABLE tbl_name (column_list)
 [[DEFAULT] CHARACTER SET charset_name]
 [COLLATE collation_name]]

ALTER TABLE tbl_name
 [[DEFAULT] CHARACTER SET charset_name]
 [COLLATE collation_name]

1、创建table并指定字符集/字符序

例子如下，指定字符集为utf8，字符序则采用默认的。

CREATE TABLE `test_schema`.`test_table` (
 `id` INT NOT NULL COMMENT '',
 PRIMARY KEY (`id`) COMMENT '')
DEFAULT CHARACTER SET = utf8;

2、查看table的字符集/字符序

同样，有3种方式可以查看table的字符集/字符序。

方式一：通过SHOW TABLE STATUS查看table状态，注意Collation为utf8_general_ci，对应的字符集为utf8。

MariaDB [blog]> SHOW TABLE STATUS FROM test_schema \G;
*************************** 1. row ***************************
  Name: test_table
  Engine: InnoDB
 Version: 10
 Row_format: Compact
  Rows: 0
 Avg_row_length: 0
 Data_length: 16384
Max_data_length: 0
 Index_length: 0
 Data_free: 11534336
 Auto_increment: NULL
 Create_time: 2018-01-09 16:10:42
 Update_time: NULL
 Check_time: NULL
 Collation: utf8_general_ci
 Checksum: NULL
 Create_options: 
 Comment: 
1 row in set (0.00 sec)

方式二：查看information_schema.TABLES的信息。

mysql> USE test_schema;
mysql> SELECT TABLE_COLLATION FROM information_schema.TABLES WHERE TABLE_SCHEMA = "test_schema" AND TABLE_NAME = "test_table";
+-----------------+
| TABLE_COLLATION |
+-----------------+
| utf8_general_ci |
+-----------------+

方式三：通过SHOW CREATE TABLE确认。

mysql> SHOW CREATE TABLE test_table;
+------------+----------------------------------------------------------------------------------------------------------------+
| Table | Create Table             |
+------------+----------------------------------------------------------------------------------------------------------------+
| test_table | CREATE TABLE `test_table` (
 `id` int(11) NOT NULL,
 PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+------------+----------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

3、table字符集、字符序如何确定

假设CHARACTER SET、COLLATE的值分别是charset_name、collation_name。如果创建table时：

明确了charset_name、collation_name，则采用charset_name、collation_name。
只明确了charset_name，但collation_name未明确，则字符集采用charset_name，字符序采用charset_name对应的默认字符序。

只明确了collation_name，但charset_name未明确，则字符序采用collation_name，字符集采用collation_name关联的字符集。

charset_name、collation_name均未明确，则采用数据库的字符集、字符序设置。

七、column的字符集、排序

类型为CHAR、VARCHAR、TEXT的列，可以指定字符集/字符序，语法如下：

col_name {CHAR | VARCHAR | TEXT} (col_length)
 [CHARACTER SET charset_name]
 [COLLATE collation_name]

1、新增column并指定字符集/排序规则

例子如下：（创建table类似）

mysql> ALTER TABLE test_table ADD COLUMN char_column VARCHAR(25) CHARACTER SET utf8;

2、查看column的字符集/字符序

例子如下：

mysql> SELECT CHARACTER_SET_NAME, COLLATION_NAME FROM information_schema.COLUMNS WHERE TABLE_SCHEMA="test_schema" AND TABLE_NAME="test_table" AND COLUMN_NAME="char_column";
+--------------------+-----------------+
| CHARACTER_SET_NAME | COLLATION_NAME |
+--------------------+-----------------+
| utf8  | utf8_general_ci |
+--------------------+-----------------+
1 row in set (0.00 sec)

3、column字符集/排序规则确定

假设CHARACTER SET、COLLATE的值分别是charset_name、collation_name：

如果charset_name、collation_name均明确，则字符集、字符序以charset_name、collation_name为准。

只明确了charset_name，collation_name未明确，则字符集为charset_name，字符序为charset_name的默认字符序。

只明确了collation_name，charset_name未明确，则字符序为collation_name，字符集为collation_name关联的字符集。

charset_name、collation_name均未明确，则以table的字符集、字符序为准。

八、选择：何时设置字符集、字符序

一般来说，可以在三个地方进行配置：

创建数据库的时候进行配置。

mysql server启动的时候进行配置。

从源码编译mysql的时候，通过编译参数进行配置

1、方式一：创建数据库的时候进行配置

这种方式比较灵活，也比较保险，它不依赖于默认的字符集/字符序。当你创建数据库的时候指定字符集/字符序，后续创建table、column的时候，如果不特殊指定，会继承对应数据库的字符集/字符序。

CREATE DATABASE mydb
 DEFAULT CHARACTER SET utf8
 DEFAULT COLLATE utf8_general_ci;

2、方式二：mysql server启动的时候进行配置

可以添加以下配置，这样mysql server启动的时候，会对character-set-server、collation-server进行配置。

当你通过mysql client创建database/table/column，且没有显示声明字符集/字符序，那么就会用character-set-server/collation-server作为默认的字符集/字符序。

另外，client、server连接时的字符集/字符序，还是需要通过SET NAMES进行设置。

[mysqld]
character-set-server=utf8
collation-server=utf8_general_ci

3、方式三：从源码编译mysql的时候，通过编译参数进行设置

编译的时候如果指定了-DDEFAULT_CHARSET和-DDEFAULT_COLLATION，那么：

创建database、table时，会将其作为默认的字符集/字符序。

client连接server时，会将其作为默认的字符集/字符序。（不用单独SET NAMES）

shell> cmake . -DDEFAULT_CHARSET=utf8 \
  -DDEFAULT_COLLATION=utf8_general_ci

九、写在后面

本文较为详细地介绍了MySQL中字符集、字符序相关的内容，这部分内容主要针对的是数据的存储与比较。其实还有很重要的一部分内容还没涉及：针对连接的字符集、字符序设置。

由于连接的字符集、字符序设置不当导致的乱码问题也非常多，这部分内容展开来讲内容也不少，放在下一篇文章进行讲解。

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

5分鐘讀懂MySQL字元集設置

一、內容概述

二、字元集、字元序的概念與聯繫

三、MySQL支援的字元集、字元序列

四、server的字元集、字元序

五、database的字符集、字符序

六、table的字符集、字符序

七、column的字符集、排序

八、选择：何时设置字符集、字符序

九、写在后面

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

MantisBT

SecLists

mPDF

SublimeText3漢化版

MinGW - Minimalist GNU for Windows

熱門話題