這篇文章主要跟大家介紹mysql中文資料的相關問題,希望對需要的朋友有幫助!
推薦參考教學:《mysql教學》
中文資料問題的本質就是字元集的問題。
由於電腦只辨識二進位數據,而人類則更傾向於辨識字元(符號),因此就需要一個二進位與字元的對應關係,也就是字元集。
在咱們透過MySQL 資料庫的客戶端向伺服器插入中文資料的時候,有可能失敗,原因則可能是客戶端和伺服器的字元集設定不同導致的,例如:
客戶端的字符集為gbk
,則一個中文字符,對應兩個位元組;
伺服器的字符集為 utf8
,則一個中文字符,對應三個位元組。
這樣顯然會在編碼轉換的過程中出現問題,從而導致插入中文資料失敗。
由於所有的資料庫伺服器表現的一些特性都是透過伺服器端的變數來維持的,因此系統會先讀取自己的變量,看看具體的表現形式。這樣的話,咱們就可以透過以下語句查看伺服器到底識別哪些字元集:
-- 查看服务器识别的全部字符集show character set;
透過以上查詢,咱們會發現:伺服器是萬能的,其支援所有字元集。
既然伺服器支援這麼多字元集,總會有一種是伺服器預設的和客戶端打交道的字元集。因此,咱可以透過以下語句查看伺服器預設的對外處理的字元集:
-- 查看服务器默认的对外处理的字符集show variables like &#MySQL 教學之中文資料問題9;character_set%&#MySQL 教學之中文資料問題9;;
標註MySQL 教學之中文資料問題:伺服器預設的客戶端傳來的資料字元集為utf8
;
標註2:連接層字元集為utf8
;
標註MySQL 教學之中文資料問題:目前資料庫的字元集為utf8
;
#標示MySQL 教學之中文資料問題:伺服器預設的對外處理的字元集utf8
.
透過上述查詢,咱們會發現:伺服器預設的對外處理的字元集是utf8
.
客戶端支援的字元集為gbk,而伺服器預設的對外處理的字元集為
utf8,因此產生矛盾。
修改伺服器預設接收的字元集為gbk.
-- 修改服务器默认接收的字符集为 GBK(不区分大小写)set character_set_client = gbk;這樣的話,咱們再插入中文資料的時候,就會插入成功啦! But,在咱們查看數據的時候,又發現了一個問題,就是之前咱們插入的中文數據顯示亂碼啦!不過這也正常,因為查詢的時候,數據的來源是伺服器(
utf8),解析數據的是客戶端,而客戶端僅識別
gbk格式的數據,顯示亂碼也就在意料之中啦!
修改伺服器給客戶端的資料字元集為gbk.
-- 修改服务器给客户端的数据字符集为 GBK(不区分大小写)set character_set_results = gbk;如上圖所示,向伺服器插入中文資料的問題已經解決啦! 此外,咱們之前使用的SQL 語句:
-- 修改的只是会话级别,即当前客户端当次连接有效,关闭后失效set 变量 = 值;這樣的話,每當咱們重啟客戶端的時候,都要依次重新進行設置,比較麻煩,因此咱們可以使用快捷的設置方式,即:
set names 字符集;例如,
/** * 恒等于 set character_set_client = gbk; * 恒等于 set character_set_results = gbk; * 恒等于 set character_set_connection = gbk; */set names gbk;表示上述語句,將同時改變三個變數的值。其中,
connection為連接層,是字元集轉換的中間者,如果其和
client和
results的字元集一致,則效率更高,不一致也沒有關係。
以上是MySQL 教學之中文資料問題的詳細內容。更多資訊請關注PHP中文網其他相關文章!