Heim >Datenbank >MySQL-Tutorial >SQL RANK() vs. ROW_NUMBER(): Wann sollten Sie die einzelnen Funktionen verwenden?

SQL RANK() vs. ROW_NUMBER(): Wann sollten Sie die einzelnen Funktionen verwenden?

DDD
DDDOriginal
2025-01-13 16:46:43918Durchsuche

SQL RANK() vs. ROW_NUMBER(): When Should You Use Each Function?

Detailliertes Verständnis der Funktionen RANK() und ROW_NUMBER() in SQL

Die Funktionen RANK() und ROW_NUMBER() in SQL sind oft verwirrend, und dieser Artikel soll die Unterschiede zwischen den beiden verdeutlichen.

Zunächst ist zu beachten, dass die SQL-Abfrageergebnisse dieser beiden Funktionen genau gleich sind, wenn in der Partition keine doppelten Werte vorhanden sind. Wenn jedoch doppelte Werte auftreten, wird der Unterschied deutlich.

Doppelte Werte und Gewissheit

Die Funktion

ROW_NUMBER() weist jeder Zeile innerhalb einer Partition einen eindeutigen inkrementellen Wert zu, auch wenn die Zeilen in der Sortierspalte denselben Wert haben. Das bedeutet, dass ROW_NUMBER() nicht deterministisch ist und der zugewiesene Wert sich bei jeder Abfrage beliebig ändern kann.

Im Gegensatz dazu sind RANK() und DENSE_RANK() innerhalb einer Partition beide deterministisch. Mehreren Zeilen wird derselbe Rangwert zugewiesen, wenn sie sowohl in der Sortierspalte als auch in der Partitionierungsspalte denselben Wert haben.

Beispiel

Betrachten Sie das folgende Beispiel:

<code class="language-sql">WITH T(StyleID, ID) AS (
    SELECT 1,1 UNION ALL
    SELECT 1,1 UNION ALL
    SELECT 1,1 UNION ALL
    SELECT 1,2
)
SELECT *,
       RANK() OVER(PARTITION BY StyleID ORDER BY ID)       AS [RANK],
       ROW_NUMBER() OVER(PARTITION BY StyleID ORDER BY ID) AS [ROW_NUMBER],
       DENSE_RANK() OVER(PARTITION BY StyleID ORDER BY ID) AS [DENSE_RANK]
FROM   T  </code>

In diesem Beispiel werden beim Sortieren nach ID innerhalb derselben Partition (StyleID) die ersten drei Zeilen dupliziert. So geht jede Funktion mit diesen doppelten Werten um:

  • ROW_NUMBER() weist aufsteigende Werte (1, 2, 3) zu und ignoriert doppelte Werte.
  • RANK() weist allen drei doppelten Zeilen den gleichen Rangwert (1) zu und springt dann zu 4 für den nächsten anderen Wert.
  • DENSE_RANK() weist doppelten Zeilen auch denselben Rangwert zu (1), erhöht sich jedoch für den nächst unterschiedlichen Wert auf 2.

Fazit

RANK() und DENSE_RANK() behalten konsistente Rankings innerhalb von Partitionen bei, selbst wenn doppelte Werte vorhanden sind. Allerdings weist ROW_NUMBER() willkürlich steigende Werte zu, was zu unvorhersehbaren Ergebnissen führen kann. Wenn Sie diese Unterschiede verstehen, können Sie die geeignete Funktion basierend auf Ihren spezifischen SQL-Anforderungen auswählen.

Das obige ist der detaillierte Inhalt vonSQL RANK() vs. ROW_NUMBER(): Wann sollten Sie die einzelnen Funktionen verwenden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn