Heim  >  Artikel  >  Datenbank  >  Wie gruppieren wir verwandte Bezeichner in einem ungerichteten Diagramm, das durch zwei Spalten, „Bezeichner1' und „Bezeichner2', dargestellt wird, und weisen ihnen eindeutige Gruppen-IDs zu?

Wie gruppieren wir verwandte Bezeichner in einem ungerichteten Diagramm, das durch zwei Spalten, „Bezeichner1' und „Bezeichner2', dargestellt wird, und weisen ihnen eindeutige Gruppen-IDs zu?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-10-29 06:32:31772Durchsuche

How do we group related identifiers in an undirected graph represented by two columns, 'Identifier1' and 'Identifier2', and assign them unique group IDs?

Suchen verbundener Teilgraphen in einem ungerichteten Diagramm

Problem:

Gegeben sei ein ungerichteter Graph, der durch zwei Spalten dargestellt wird, „Bezeichner1“ und „Bezeichner2“, Wie gruppieren wir Bezeichner, die miteinander in Beziehung stehen, und weisen ihnen eindeutige Gruppen-IDs zu?

Lösung:

Dieses Problem kann gelöst werden, indem die Daten als Kanten in einem Diagramm behandelt und alle Kanten durchlaufen werden rekursiv.

Rekursiver Algorithmus:

  1. Erstellen Sie eine Tabelle mit allen eindeutigen Bezeichnern aus beiden Spalten.
  2. Erstellen Sie eine Tabelle mit allen Kanten (Bezeichnerpaaren) in beiden Richtungen.
  3. Definieren Sie eine rekursive Abfrage, die den Graphen ausgehend von jedem Bezeichner durchläuft und einen Pfad der durchlaufenen Bezeichner erstellt.
  4. Gruppieren Sie die Ergebnisse nach dem Startbezeichner (Ankerbezeichner), um verbundene Komponenten zu identifizieren.
  5. Weisen Sie jeder verbundenen Komponente basierend auf der Anker-ID eine eindeutige Gruppen-ID zu.

Beispielabfrage (SQL):

<code class="sql">WITH
CTE_Idents AS (
    SELECT Ident1 AS Ident
    FROM @T

    UNION

    SELECT Ident2 AS Ident
    FROM @T
),
CTE_Pairs AS (
    SELECT Ident1, Ident2
    FROM @T
    WHERE Ident1 <> Ident2

    UNION

    SELECT Ident2 AS Ident1, Ident1 AS Ident2
    FROM @T
    WHERE Ident1 <> Ident2
),
CTE_Recursive AS (
    SELECT
        CAST(CTE_Idents.Ident AS varchar(8000)) AS AnchorIdent 
        , Ident1
        , Ident2
        , CAST(',' + Ident1 + ',' + Ident2 + ',' AS varchar(8000)) AS IdentPath
        , 1 AS Lvl
    FROM 
        CTE_Pairs
        INNER JOIN CTE_Idents ON CTE_Idents.Ident = CTE_Pairs.Ident1

    UNION ALL

    SELECT 
        CTE_Recursive.AnchorIdent 
        , CTE_Pairs.Ident1
        , CTE_Pairs.Ident2
        , CAST(CTE_Recursive.IdentPath + CTE_Pairs.Ident2 + ',' AS varchar(8000)) AS IdentPath
        , CTE_Recursive.Lvl + 1 AS Lvl
    FROM
        CTE_Pairs
        INNER JOIN CTE_Recursive ON CTE_Recursive.Ident2 = CTE_Pairs.Ident1
    WHERE
        CTE_Recursive.IdentPath NOT LIKE CAST('%,' + CTE_Pairs.Ident2 + ',%' AS varchar(8000))
),
CTE_RecursionResult AS (
    SELECT AnchorIdent, Ident1, Ident2
    FROM CTE_Recursive
),
CTE_CleanResult AS (
    SELECT AnchorIdent, Ident1 AS Ident
    FROM CTE_RecursionResult

    UNION

    SELECT AnchorIdent, Ident2 AS Ident
    FROM CTE_RecursionResult
)
SELECT
    CTE_Idents.Ident
    ,CASE WHEN CA_Data.XML_Value IS NULL 
    THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END AS GroupMembers
    ,DENSE_RANK() OVER(ORDER BY 
        CASE WHEN CA_Data.XML_Value IS NULL 
        THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END
    ) AS GroupID
FROM
    CTE_Idents
    CROSS APPLY
    (
        SELECT CTE_CleanResult.Ident+','
        FROM CTE_CleanResult
        WHERE CTE_CleanResult.AnchorIdent = CTE_Idents.Ident
        ORDER BY CTE_CleanResult.Ident FOR XML PATH(''), TYPE
    ) AS CA_XML(XML_Value)
    CROSS APPLY
    (
        SELECT CA_XML.XML_Value.value('.', 'NVARCHAR(MAX)')
    ) AS CA_Data(XML_Value)
WHERE
    CTE_Idents.Ident IS NOT NULL
ORDER BY Ident;</code>

Wichtige Punkte:

  • Der rekursive CTE (Common Table Expression) durchläuft den Graphen und erstellt verbundene Komponenten.
  • Die abschließende SELECT-Anweisung weist Gruppen-IDs zu und generiert eine Ausgabe im gewünschten Format.
  • Diese Lösung ist optimiert, um redundante Berechnungen zu vermeiden und effiziente Ergebnisse zu liefern.

Das obige ist der detaillierte Inhalt vonWie gruppieren wir verwandte Bezeichner in einem ungerichteten Diagramm, das durch zwei Spalten, „Bezeichner1' und „Bezeichner2', dargestellt wird, und weisen ihnen eindeutige Gruppen-IDs zu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn