Maison  >  Article  >  base de données  >  Comment supprimer les requêtes en double dans SQL

Comment supprimer les requêtes en double dans SQL

coldplay.xixi
coldplay.xixioriginal
2020-10-10 11:37:2915951parcourir

Méthode de requête de déduplication SQL : les enregistrements en double sont jugés sur la base d'un seul champ peopleId et supprimés à l'aide d'instructions. Le code est [où peopleId in (sélectionnez peopleId dans le groupe de personnes par peopleId].

Comment supprimer les requêtes en double dans SQL

Méthode de requête de déduplication SQL :

Requête SQL table unique/multi-table pour supprimer les enregistrements en double

Table unique distincte

Plusieurs tables group by

group by doivent être placées avant la commande par et la limite, sinon une erreur sera signalée

1 Recherchez les enregistrements en double redondants dans la table. Les enregistrements en double sont basés sur un seul champ. (peopleId) pour juger

select * from people
where peopleId in (select  peopleId  from  people  group  by  peopleId  having  count(peopleId) > 1)

2. Supprimez les enregistrements en double redondants dans la table. Les enregistrements en double sont jugés sur la base d'un seul champ (peopleId), ne laissant que l'enregistrement avec le. le plus petit rowid

delete from people
where peopleId  in (select  peopleId  from people  group  by  peopleId   having  count(peopleId) > 1)
and rowid not in (select min(rowid) from  people  group by peopleId  having count(peopleId )>1)

3. Recherchez les enregistrements en double redondants (plusieurs champs) dans la table

select * from vitae a
where (a.peopleId,a.seq) in  (select peopleId,seq from vitae group by peopleId,seq  having count(*) > 1)

4 Supprimez les enregistrements en double redondants (plusieurs champs) dans la table, en ne laissant que l'enregistrement avec le plus petit. rowid

delete from vitae a
where (a.peopleId,a.seq) in  (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

5. Recherchez les enregistrements en double redondants (plusieurs champs) dans la table, en excluant l'enregistrement avec le plus petit rowid

select * from vitae a
where (a.peopleId,a.seq) in  (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

(2)

Par exemple,

a un champ dans la table A "nom",

et la valeur "nom" entre différents enregistrements peut être la même,

Nous devons maintenant interroger la valeur "nom" entre chaque enregistrement du tableau Il y a des éléments en double ;

Select Name,Count(*) From A Group By Name Having Count(*) > 1

Si le sexe est également vérifié et que les résultats sont les mêmes, les résultats sont les suivants :

Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1

(3)

Méthode 1

declare @max integer,@id integer
declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >; 1
open cur_rows
fetch cur_rows into @id,@max
while @@fetch_status=0
begin
select @max = @max -1
set rowcount @max
delete from 表名 where 主字段 = @id
fetch cur_rows into @id,@max
end
close cur_rows
set rowcount 0

Méthode 2

Les "enregistrements en double" ont deux significations : les enregistrements en double, l'un est un enregistrement complètement en double, c'est-à-dire un enregistrement dans lequel tous les champs sont répétés, et l'autre est un enregistrement dans lequel certains champs clés sont répétés, comme un champ Nom en double, et d'autres champs ne sont pas nécessairement dupliqués ou peuvent être ignorés

1 Pour le premier type de duplication, c'est le cas. plus facile à résoudre. Utilisez

select distinct * from tableName

pour obtenir un ensemble de résultats sans enregistrements en double

Si la table doit supprimer les enregistrements en double (conserver 1 enregistrement en double), vous pouvez le supprimer comme suit

select distinct * into #Tmp from tableName
drop table tableName
select * into tableName from #Tmp
drop table #Tmp
<.>La raison de cette duplication est une mauvaise conception de la table. Ajoutez une colonne d'index unique qui peut être résolue

2. Ce type de problème de duplication nécessite généralement de conserver le premier enregistrement dans les enregistrements en double. est la suivante

Supposons qu'il existe des champs en double nommés Nom et Adresse, et il est nécessaire pour obtenir ces deux champs Un ensemble de résultats avec des champs uniques

select identity(int,1,1) as autoID, * into #Tmp from tableName
select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID
select * from #Tmp where autoID in(select autoID from #tmp2)

La dernière sélection donne un résultat non. -ensemble de résultats en double de nom et d'adresse (mais il existe un champ autoID supplémentaire, qui peut être écrit dans la clause select pour omettre cette colonne lors de l'écriture)

(4)

Requête en double

select * from tablename where id in (select id from tablename
group by id
having count(id) > 1
)

3. Des enregistrements en double excessifs (plusieurs champs) dans la table de recherche

select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

entraîneront des problèmes lors de l'exécution. L'écriture comme Where(a.peopleId,a.seq) ne passera pas ! ! !

Recommandations d'apprentissage associées :
Tutoriel vidéo SQL

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn