Heim >Datenbank >MySQL-Tutorial >Wie entferne ich effizient doppelte Zeilen aus einer Tabelle ohne eindeutige Bezeichner?

Wie entferne ich effizient doppelte Zeilen aus einer Tabelle ohne eindeutige Bezeichner?

Susan Sarandon
Susan SarandonOriginal
2025-01-23 01:41:08645Durchsuche

How to Efficiently Remove Duplicate Rows from a Table Without Unique Identifiers?

Doppelte Zeilen ohne eindeutige Kennungen effizient entfernen

Das Entfernen von Duplikaten kann eine Herausforderung sein, wenn einer Datentabelle eindeutige Zeilenbezeichner fehlen. Dieser Artikel bietet eine effiziente Lösung zum Entfernen doppelter Zeilen unter Beibehaltung des ersten Vorkommens der Zeile.

Sehen wir uns eine Tabelle mit doppelten Zeilen an:

col1 col2 col3 col4 col5 col6 col7
john 1 1 1 1 1 1
john 1 1 1 1 1 1
sally 2 2 2 2 2 2
sally 2 2 2 2 2 2

Das gewünschte Ergebnis nach dem Entfernen doppelter Zeilen ist:

col1 col2 col3 col4 col5 col6 col7
john 1 1 1 1 1 1
sally 2 2 2 2 2 2

Lösung mit CTE und ROW_NUMBER

Diese Methode nutzt den Common Table Expression (CTE) und die Funktion ROW_NUMBER(). CTE weist jeder Zeile eine Sequenznummer (RN) basierend auf einer bestimmten Reihenfolge zu, sodass wir Duplikate identifizieren und beseitigen können.

Hier ist die SQL-Abfrage mit Schritt-für-Schritt-Anleitung:

<code class="language-sql">WITH CTE AS (
   SELECT [col1], [col2], [col3], [col4], [col5], [col6], [col7],
       RN = ROW_NUMBER() OVER (PARTITION BY col1 ORDER BY col1) -- 为 col1 定义的每个组内分配序列号
   FROM dbo.Table1
)
DELETE FROM CTE WHERE RN > 1; -- 删除 RN 大于 1 的行(表示重复项)</code>

Anleitung:

  • CTE-Erstellung: Die WITH-Anweisung erstellt einen CTE namens CTE, der die Spalten der Tabelle enthält und jeder Zeile mithilfe der Funktion ROW_NUMBER() RN-Werte zuweist. Die PARTITION BY-Klausel gruppiert die Zeilen basierend auf der Spalte „col1“ und sortiert sie innerhalb jeder Gruppe, um die Reihenfolge zu bestimmen.
  • ROW_NUMBER()-Funktion: Die ROW_NUMBER()-Funktion generiert eine Folge von Ganzzahlen beginnend bei 1 für jede Zeile innerhalb jeder durch die PARTITION BY-Klausel definierten Partition.
  • Löschvorgang: Die DELETE-Anweisung löscht Zeilen mit RN größer als 1 im CTE und eliminiert dadurch doppelte Zeilen.

Ausgabe:

Nach der Ausführung der Abfrage enthält die aktualisierte Tabelle:

col1 col2 col3 col4 col5 col6 col7
john 1 1 1 1 1 1
sally 2 2 2 2 2 2

Das obige ist der detaillierte Inhalt vonWie entferne ich effizient doppelte Zeilen aus einer Tabelle ohne eindeutige Bezeichner?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn