UTF-8編碼是目前應用最廣泛的字元編碼格式,MySQL 也可以支援使用 UTF-8 編碼儲存資料。但是,在使用 MySQL 儲存 UTF-8 編碼的資料時,可能會出現亂碼的問題。這篇文章將介紹在 MySQL 中遇到 UTF-8 編碼亂碼的原因以及解決方法。
因為歷史原因,MySQL 預設採用的是 Latin1(ISO-8859-1)編碼格式。這種編碼格式對於大部分西方語言來說還是不錯的。但是對於亞洲語言、中東語言等使用複雜字符集的語言來說,就顯得力不足了。
隨著網路科技的發展,越來越多的國家和地區使用非拉丁字母的字元集進行文字溝通。為了解決這個問題,MySQL 推出了 UTF-8 編碼格式,讓 MySQL 能夠儲存更豐富的語言文字。 UTF-8(8-bit Unicode Transformation Format)編碼是一種可變長度字符編碼,支援 Unicode 標準中的所有字符,但是在MySQL 中進行 UTF-8 編碼存儲時,可能會出現亂碼的情況。
出現亂碼的原因與解決方法:
問題1:MySQL 表的 CHARSET 不是 UTF-8 格式。
在建立表格時,如果沒有指定 CHARSET,則預設使用資料庫的 CHARSET。因此,當資料庫CHARSET 不是 UTF-8 時,儲存 UTF-8 編碼的資料會出現亂碼。
1.1 查看資料庫的CHARSET
首先需要查看資料庫的CHARSET,透過以下指令可以查看目前的資料庫CHARSET:
mysql> show create database databaseName;
1.2 修改資料庫的CHARSET
如果資料庫的CHARSET 不是UTF-8 ,需要修改資料庫的CHARSET。可以透過以下步驟修改資料庫的 CHARSET:
1.2.1 備份資料庫
#因為我們需要修改資料庫的 CHARSET,所以需要先備份資料庫。
1.2.2 修改資料庫預設編碼
在 MySQL 中,建立資料庫時可以指定預設編碼,預設編碼一般設定為 UTF-8 ,這裡示範如何修改預設編碼。
修改MySQL 的設定檔/etc/mysql/mysql.conf.d/mysqld.conf,找到"[mysqld]",加入以下內容:
[mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_general_ci
修改完成之後,儲存並退出。
1.2.3 修改資料庫和表格編碼
在MySQL 中,可以透過以下SQL 語句查看資料庫、表格、列的編碼:
/*查看数据库使用的编码*/ SHOW VARIABLES LIKE 'character_set_database'; /*查看数据表使用的编码*/ SHOW FULL COLUMNS FROM 表名; /*查看列使用的编码*/ SELECT column_name, character_set_name FROM information_schema.columns WHERE table_name='表名';
如果目前的編碼沒有使用UTF-8,那麼需要將資料庫、表格、列的編碼都修改為UTF-8 ,可以透過以下SQL 語句進行修改:
/*修改数据库编码为 utf8mb4 */ ALTER DATABASE databaseName CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; /*修改表编码为 utf8mb4*/ ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; /*修改列编码为 utf8mb4*/ ALTER TABLE 表名 MODIFY COLUMN 列名 varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
修改完成之後,再次執行以上檢視編碼方法,確認CHARSET為UTF-8 編碼。
問題2:資料庫連接未設定UTF-8 編碼
在應用程式連接MySQL 資料庫時,需要指定連接字元集,如果沒有設定UTF-8 編碼,則在讀取和寫入UTF -8 編碼的資料時就會出現亂碼。在連接MySQL 資料庫時,可以透過以下語句設定UTF-8 編碼:
SET NAMES utf8mb4;
問題3: MySQL 用戶端顯示編碼問題
在使用命令列方式執行SQL 語句是,可能會出現亂碼現象,主要是因為客戶端顯示亂碼。可以透過設定 MySQL 客戶端的編碼格式來解決該問題。
3.1 Linux/MacOSX 用戶端解決亂碼
在Linux 和MacOSX 系統中,可以透過以下指令設定MySQL 用戶端編碼格式:
export LANG=en_US.UTF-8 export LC_ALL=en_US.UTF-8
設定完成後,可以執行MySQL 用戶端,執行SQL 語句,正常顯示中文字元。
3.2 Windows 用戶端解決亂碼
在Windows 系統中,可以透過下列步驟設定MySQL 用戶端編碼格式:
開啟控制面板-> 系統與安全性- > 系統-> 進階系統設定-> 環境變數
在環境變數中,新系統變數:
变量名:LANG 变量值:zh_CN.UTF-8
設定完成後,可以執行MySQL 用戶端,執行SQL 語句,正常顯示中文字元。
總結:
在 MySQL 中儲存 UTF-8 編碼資料時,可能會出現亂碼的問題。亂碼問題的原因主要是表的 CHARSET 不是 UTF-8 編碼格式、資料庫連線未設定 UTF-8 編碼、MySQL 用戶端顯示編碼問題。透過在 MySQL 中正確設定 CHARSET、連接字元集、客戶端編碼格式,可以解決 UTF-8 編碼亂碼的問題。
以上是utf8 mysql 亂碼的詳細內容。更多資訊請關注PHP中文網其他相關文章!