MySQL的客户端可以分为两种:一种就是用C语言写的官方客户端――MySQL命令程序;一种就是平常程序员使用JDBC等connector API写成的客户端。这里只讨论第一种。 MySQL命令程序在Windows和Linux系统中关于字符编码处理的部分并不等效,下图是Windows系统的客户端字符编码转换逻辑: 其中的三个character变量存在于服务器上,而charset_info存在于客户端。 由于在Windows平台上MySQL程序在读取控制台时使用了Unicode Console Read API,所以程序从控制台获取的原始字符串实际上是UTF16编码,所以这里的“操作系统编码”并不是Windows通常的GBK,而应该看做UTF16。 下图是Linux系统中的MySQL客户端程序字符编码转换逻辑: vcyoTXlTUUyMySQL的字符编码体系(二)――数据传输编码_MySQLzbuntsuy6dGvzazSu7j2se21w7W9tcTItMrHwtLC66GjPGJyPgqMySQL的字符编码体系(二)――数据传输编码_MySQLydLU1eLR cSjxOLJz8r2tcTH6bMySQL的字符编码体系(二)――数据传输编码_MySQL2o7o8YnI CrS0vajSu7j2se2jrMbk1tDWu7D8uqzSu7j2R0JL19a3 7Su19a2zrrNVVRGONfWtMySQL的字符编码体系(二)――数据传输编码_MySQLu0rtfWts6ho0xpbnV41tDG9LavTXlTUUzBrL3Ttb3KMySQL的字符编码体系(二)――数据传输编码_MySQLb7dv K3MySQL的字符编码体系(二)――数据传输编码_MySQLs7xxvejrL2rtMySQL的字符编码体系(二)――数据传输编码_MySQL7O8cb3tcTIMySQL的字符编码体系(二)――数据传输编码_MySQLbj2Y2hhcmFjdGVyseTBv7TTxKzIz7XEVVRGONDeuMTOqkdCS6GjzMySQL的字符编码体系(二)――数据传输编码_MySQLLKMySQL的字符编码体系(二)――数据传输编码_MySQLb7dv Ky5cjr1tDOxMr9vt2jrMGivLRzZWxlY3SjrL3hufvO3tLss6OjujwvcD4KPHA PGltZyBzcmM9"http:MySQL的字符编码体系(二)――数据传输编码_MySQLMySQL的字符编码体系(二)――数据传输编码_MySQLwww.bitsCN.comMySQL的字符编码体系(二)――数据传输编码_MySQLuploadfileMySQL的字符编码体系(二)――数据传输编码_MySQLCollfilesMySQL的字符编码体系(二)――数据传输编码_MySQL20140714MySQL的字符编码体系(二)――数据传输编码_MySQL2014071409163740.png" alt="MySQL的字符编码体系(二)――数据传输编码_MySQL"> 但是使用Windows的MySQL客户端查询时,结果却是乱码: 结合前面的数据传输流程,就能知道问题出在什么地方: 如果Windows客户端也想看到正确的结果,那就要故意错误地配置:Windows客户端
当客户端启动连接到服务器时,客户端将根据配置参数设置charset_info为指定编码,同时通知服务器让服务器把三个character变量设置为相同编码。数据传输流程
Linux客户端
乱码分析
表中的字符串不经过任何转码直接发给客户端,因为character_set_results也是GBK;客户端收到查询结果后因为忽略charset_info而直接不经过转码输出到终端标准输出;终端得到的数据实际上是UTF8编码的,所以正常输出。在Windows客户端查询时:
表中的字符串(UTF8)不经过任何转码直接发给客户端,因为character_set_results也是GBK;客户端收到查询结果后认为是charset_info编码(此时为GBK);客户端把查询结果从charset_info转码为UTF16,然后调用Unicode Console Write API输出,看到乱码。乱码“修复”