Rumah >pangkalan data >tutorial mysql >如何删除数据库中的重复记录?

如何删除数据库中的重复记录?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBasal: 2016-06-07 15:56:081768semak imbas

一、题外篇今天很悲催啊，给用户数据做datapatch的时候，每个月的数据多导入了一份，瞬间惊出一身冷汗... 这可是产品环境，要是被老板知道了可就死定了，赶紧去掉重复的记录，同时写下下面的文章以备后用。二、准备篇 1. 先创建一张学生表student： create

一、题外篇

今天很悲催啊，给用户数据做datapatch的时候，每个月的数据多导入了一份，瞬间惊出一身冷汗... 这可是产品环境，要是被老板知道了可就死定了，赶紧去掉重复的记录，同时写下下面的文章以备后用。

二、准备篇

1. 先创建一张学生表student：

create table student(
       id varchar(10) not null,
       name varchar(10) not null,
       age number not null
);

2. 插入几条数据到表student：

insert into student values(&#39;1&#39;, &#39;zhangs&#39;, 20);
insert into student values(&#39;1&#39;, &#39;zhangs&#39;, 20);
insert into student values(&#39;2&#39;, &#39;zhangs&#39;, 20);
insert into student values(&#39;3&#39;, &#39;lisi&#39;, 20);
insert into student values(&#39;4&#39;, &#39;lisi&#39;, 30);
insert into student values(&#39;5&#39;, &#39;wangwu&#39;, 30);

三、处理篇

1. 使用rowid

① 查询:

select *
  from student s1
 where rowid != (select max(rowid)
                   from student s2
                  where s1.id = s2.id
                    and s1.name = s2.name
                    and s1.age = s2.age)

注: rowid是唯一标志记录物理位置的一个id, 括号中是查询出重复数据中rowid最大的一条.

② 删除:

delete from student s1
 where rowid != (select max(rowid)
                   from student s2
                  where s1.id = s2.id
                    and s1.name = s2.name
                    and s1.age = s2.age)

2. 使用 group by 和 having

① 查询:

select id, name, age, count(*)
  from student
 group by id, name, age
having count(*) > 1;

3. 使用distinct

create table stud_temp as select distinct * from student; -- 创建临时表 stud_temp
truncate table student; -- 清空student表
insert into student select * from stud_temp; -- 将临时表数据导入student表
drop table stud_temp; -- 删除临时表

注: distinct只适用于对小表处理, 如果是千万级别数据的表, 请使用rowid, 因为它具有唯一性, 效率更高.

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Hadoop配置文件与HBase配置文件Artikel seterusnya：读《软件调试》第九章

Artikel berkaitan

Lihat lagi