집 >데이터 베이스 >MySQL 튜토리얼 >解决mysql中文排序无效方法
中文排名在mysql中是一个比较纠结的问题,由于mysql默认的是uft8数据库编码,所以如果你在未操作的情况下来对中文进行排序是很不理想的,我们可以对数据库或mysql查询进行修改。
解决方法:
1.对于包含中文的字段加上"binary"属性,使之作为二进制比较,例如将"name char(10)"改成"name char(10)binary"。
2.如果你使用源码编译MySQL,可以编译MySQL时使用 --with--charset=gbk 参数,这样MySQL就会直接支持中文查找和排序了(默认的是latin1)。也可以用 extra-charsets=gb2312,gbk 来加入多个字符集
解决方法二,不影响到其它mysql服务器直接在select查询中转换
1、不想改变表定义及默认编码的情况,将字段先转换成gbk编码再排序:
代码如下 | 复制代码 |
SELECT * FROM table ORDER BY CONVERT( chinese_field USING gbk ) ; 或 select name from test1 order by convert(name using gb2312) asc; |
前提是在安装mysql时安装了gbk字符集,不然会报错:
#1115 - Unknown character set: 'gbk'
在编译源码时加上gbk编码即可,如果已经安装好了,重新编译再安装,重新编译安装一般不会影响mysql的已有设置,包括数据都不会受到影响。
2、直接将字段的字符集改成gbk,然后直接使用order by 排序即可。
mysql 5.x支持某列单独定义字符集。
3、网上也有人说将字段定义加上binary属性也能达到效果,未作测试,不敢评论。
mysql的文档中也提到字符集校对规则:
代码如下 | 复制代码 |
SELECT * FROM t1 ORDER BY a COLLATE utf8_bin; |
结论是:查询的时候,通过convert函数,把查询出来的数据使用的字符集gb2312编码就可以了,然后使用convert之后的中文排序。但是如果真的去把表中字段的字符集改成gb2312,又会涉及到很多编码的问题,页面传值啊,从数据库中存取啊,很麻烦。只要在查询的时候,指定一下字符集,并不是真的把物理字段改成gb2312,很简单。