Heim >Datenbank >MySQL-Tutorial >Wie entferne ich effizient doppelte Zeilen aus einer Tabelle ohne eindeutige Bezeichner?
Doppelte Zeilen ohne eindeutige Kennungen effizient entfernen
Das Entfernen von Duplikaten kann eine Herausforderung sein, wenn einer Datentabelle eindeutige Zeilenbezeichner fehlen. Dieser Artikel bietet eine effiziente Lösung zum Entfernen doppelter Zeilen unter Beibehaltung des ersten Vorkommens der Zeile.
Sehen wir uns eine Tabelle mit doppelten Zeilen an:
col1 | col2 | col3 | col4 | col5 | col6 | col7 |
---|---|---|---|---|---|---|
john | 1 | 1 | 1 | 1 | 1 | 1 |
john | 1 | 1 | 1 | 1 | 1 | 1 |
sally | 2 | 2 | 2 | 2 | 2 | 2 |
sally | 2 | 2 | 2 | 2 | 2 | 2 |
Das gewünschte Ergebnis nach dem Entfernen doppelter Zeilen ist:
col1 | col2 | col3 | col4 | col5 | col6 | col7 |
---|---|---|---|---|---|---|
john | 1 | 1 | 1 | 1 | 1 | 1 |
sally | 2 | 2 | 2 | 2 | 2 | 2 |
Lösung mit CTE und ROW_NUMBER
Diese Methode nutzt den Common Table Expression (CTE) und die Funktion ROW_NUMBER(). CTE weist jeder Zeile eine Sequenznummer (RN) basierend auf einer bestimmten Reihenfolge zu, sodass wir Duplikate identifizieren und beseitigen können.
Hier ist die SQL-Abfrage mit Schritt-für-Schritt-Anleitung:
<code class="language-sql">WITH CTE AS ( SELECT [col1], [col2], [col3], [col4], [col5], [col6], [col7], RN = ROW_NUMBER() OVER (PARTITION BY col1 ORDER BY col1) -- 为 col1 定义的每个组内分配序列号 FROM dbo.Table1 ) DELETE FROM CTE WHERE RN > 1; -- 删除 RN 大于 1 的行(表示重复项)</code>
Anleitung:
Ausgabe:
Nach der Ausführung der Abfrage enthält die aktualisierte Tabelle:
col1 | col2 | col3 | col4 | col5 | col6 | col7 |
---|---|---|---|---|---|---|
john | 1 | 1 | 1 | 1 | 1 | 1 |
sally | 2 | 2 | 2 | 2 | 2 | 2 |
Das obige ist der detaillierte Inhalt vonWie entferne ich effizient doppelte Zeilen aus einer Tabelle ohne eindeutige Bezeichner?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!