Home >Database >Mysql Tutorial >mysqli_set_charset和SET NAMES优劣分析

mysqli_set_charset和SET NAMES优劣分析

WBOY
WBOYOriginal
2016-06-07 17:52:381090browse

本文章来分析一下关于mysqli_set_charset和SET NAMES吧,有需要学习的朋友可参考参考。

我最常用会用set names来解决php与mysql乱码问题

程序设置

 代码如下 复制代码

mysql_query("SET NAMES UTF8");

my.ini设置

# CLIENT SECTION

[mysql]

default-character-set=utf8

# SERVER SECTION

[mysqld]

default-character-set=utf8


 

这两个字段来更改数据库的默认字符集。第一个是客户端默认的字符集,第二个是服务器端默认的字符集。假设我们把两个都设为utf8,然后在MySQL Command Line Client里面输入“show variebles like“character_set_%”;”,可看到如下字符:

 代码如下 复制代码
character_set_client   latin1
character_set_connection    latin1
character_set_database     utf8
character_set_results    latin1
character_set_server   utf8
character_set_system     utf8

其中的utf8随着我们上面的设置而改动。此时,要是我们通过采用UTF-8的PHP程序从数据库里读取数据,很有可能是一串“?????”或者是其他乱码。网上查了半天,解决办法倒是简单,在连接数据库之后,读取数据之前,先执行一项查询“SET NAMES UTF8”,即在PHP里为

即可显示正常(只要数据库里信息的字符正常)。为什么会这样?这句查询“SET NAMES UTF8”到底是什么作用?
到MySQL命令行输入“SET NAMES UTF8;”,然后执行“show variebles like“character_set_%”;”,发现原来为latin1的那些变量“character_set_client”、“character_set_connection”、“character_set_results”的值全部变为utf8了,原来是这3个变量在捣蛋。查阅手册,上面那句等于:

 代码如下 复制代码


SET character_set_client = utf8;

SET character_set_results = utf8;

SET character_set_connection = utf8;


这里要声明一点,“SET NAMES UTF8”作用只是临时的,MySQL重启后就恢复默认了。
接下来就说到MySQL在服务器上的配置问题了。岂不是我们每次对数据库读写都得加上“SET NAMESUTF8”,以保证数据传输的编码一致?能不能通过配置MySQL来达到那三个变量默认就为我们要想的字符集?手册上没说,我在网上也没找到答案。所以,从服务器配置的角度而言,是没办法省略掉那行代码的


那mysql_set_character_set又做了什么呢?

 代码如下 复制代码

//mysql-5.1.30-SRC/libmysql/client.c, line 3166:
 int STDCALLmysql_set_character_set(MYSQL*mysql, const char *cs_name)
 {
   structcharset_info_st *cs;
   const char *save_csdir= charsets_dir;
 
   if (mysql->options.charset_dir)
     charsets_dir= mysql->options.charset_dir;
 
   if (strlen(cs_name)       (cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0))))
   {
     char buff[MY_CS_NAME_SIZE + 10];
     charsets_dir= save_csdir;
     /* Skip execution of "SET NAMES" for pre-4.1 servers */
     if (mysql_get_server_version(mysql)        return 0;
     sprintf(buff, "SET NAMES %s", cs_name);
     if (!mysql_real_query(mysql, buff, strlen(buff)))
     {
       mysql->charset= cs;
     }
   }
   //以下省略

我们可以看到, mysqli_set_charset除了做了”SET NAMES”以外, 还多做了一步:

 代码如下 复制代码

 sprintf(buff, "SET NAMES %s", cs_name);
 if (!mysql_real_query(mysql, buff, strlen(buff)))
 {
   mysql->charset= cs;
 }


而对于mysql这个核心结构的成员charset又有什么作用呢?

这就要说说mysql_real_escape_string()了, 这个函数和mysql_escape_string的区别就是, 它会考虑”当前”字符集. 那么这个当前字符集从哪里来呢?

对了, 你猜的没错, 就是mysql->charset.

mysql_real_string在判断宽字符集的字符的时候, 就根据这个成员变量来分别采用不同的策略, 比如如果是utf-8, 那么就会采用libmysql/ctype-utf8.c.

 代码如下 复制代码


     $db = mysql_connect('localhost:3737', 'root' ,'123456');
     mysql_select_db("test");
     $a = "x91x5c";//"?"的gbk编码, 低字节为5c, 也就是ascii中的""
 
     var_dump(addslashes($a));
     var_dump(mysql_real_escape_string($a, $db));
 
     mysql_query("set names gbk");
     var_dump(mysql_real_escape_string($a, $db));
 
     mysql_set_charset("gbk");
     var_dump(mysql_real_escape_string($a, $db));
 ?>

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn