比特网
4 行一组(0.00 秒)
mysql>创建临时表 tmp_wrap select * from users_groups group by uidhaving count(1) > 1 union all
从 users_groups 组中按 count(1) = 1 的 uid 选择 *;
查询正常,受影响 7 行(0.11 秒)
记录:7 重复:0 警告:0
mysql> truncate table users_groups;
查询正常,14行受影响(0.03秒)
mysql>; insert into users_groups select * from tmp_wrap;
查询正常,受影响 7 行(0.03 秒)
记录:7 重复:0 警告:0
mysql> select * from users_groups;
查询结果(7条记录)
id uid gid
1 11 502
2 107 502
3 100 503
4 110 501
5 112 501
6 104 502
9 102 501
mysql> drop table tmp_wrap;
2、还有一个很专业的方法。
查找重复的,并且除掉最小的那个。
从 users_groups as a 中删除 users_groups as a,
(
select *,min(id) from users_groups group by uidhaving count(1) > 1
) as b
,其中 a.uid = b.uid和a.id> b.id;
(受影响的 7 行)
(占用 0 毫秒)
查询结果(7 条记录)
id uid gid
1 11 502
2 107 502
3 100 503
4 110 501
5 112 501
6 104 502
9 102 501
3、现在看看这两种方法的效率。
运行一下以下SQL语句
create index f_uid on users_groups(uid);
explain select * from users_groups group by uidhaving count(1) > 1 union all
select * from users_groups group by uid with count(1) = 1;
解释 select * from users_groups as a,
(
select *,min(id) from users_groups group by uid 具有 count(1) > 1
) 作为 b
,其中 a.uid = b.uid 且 a.id > b.id;
查询结果(3条记录)
id select_type 表类型 possible_keys key key_len ref rows 额外
1 PRIMARY users_groups 索引 (NULL) f_uid 4 (NULL) 14
2 UNION users_groups 索引 ( NULL) f_uid 4 (NULL) 14
(NULL) 联合结果
查询结果(3条记录)
id select_type 表类型 possible_keys key key_len ref rows 额外
1 PRIMARY ; ALL (NULL) (NULL) (NULL) (NULL) 4
1 PRIMARY a ref PRIMARY,f_uid f_uid 4 b.uid 1 使用 where
2 派生的 users_groups 索引 (NULL) f_uid 4 (NULL) 14
很明显的第二个比第一个扫描的函数要少。