Heim > Artikel > Technologie-Peripheriegeräte > Jia Qianghuai: Konstruktion und Anwendung eines groß angelegten Wissensgraphen von Ameisen
Stellen Sie zunächst einige grundlegende Konzepte des Wissensgraphen vor.
Der Wissensgraph zielt darauf ab, komplexe Beziehungen zwischen Dingen zu modellieren, zu identifizieren und abzuleiten. Er ist ein wichtiger Eckpfeiler für die Verwirklichung kognitiver Intelligenz hat Es wird häufig in Suchmaschinen, intelligenter Beantwortung von Fragen, sprachsemantischem Verständnis, Big-Data-Entscheidungsanalyse und vielen anderen Bereichen verwendet.
Knowledge Graph modelliert sowohl die semantische Beziehung als auch die strukturelle Beziehung zwischen Daten. In Kombination mit Deep-Learning-Technologie können die beiden Beziehungen besser integriert und dargestellt werden.
[2] Wissensgraphen können mehrere Vorteile bringen, darunter:
Semantische Standardisierung: Verwenden Sie Graphkonstruktionstechnologie, um den Standardisierungs- und Normalisierungsgrad von Entitäten, Beziehungen, Konzepten usw. zu verbessern.
Die Integration der strukturierten Wissensbasis in der Geschäftsdomäne und des vorhandenen Wissensgraphen wird auch durch Entity-Alignment-Technologie erreicht.
Unstrukturierte und halbstrukturierte Daten, wie z. B. Text, werden verwendet, um Informationen zu extrahieren und die vorhandene Karte durch Entity-Link-Technologie zu aktualisieren.
Der Prozess der Kartenkonstruktion umfasst hauptsächlich sechs Schritte:
Beim Aufbau eines Wissensgraphen ist es notwendig, die Eingabeentitäten zu klassifizieren, was in der Ameise ein großes Problem darstellt Szenario Etikettenklassifizierungsaufgabe. Um Expertenwissen für die Entitätsklassifizierung zu integrieren, werden die folgenden drei Hauptoptimierungspunkte festgelegt:
Auf der Grundlage der Entitätserkennung lernt das Modell, ausgehend von der Diagrammstruktur der Wortkanten, eine angemessene Gewichtung von Kanten und verrauschten Wortverbindungen. Reduzieren Sie das Gewicht der Kante . Es werden zwei Module vorgeschlagen: grenzkontrastives Lernen und semantisch-kontrastives Lernen:
Bei Domänenproblemen haben wir nur sehr wenige beschriftete Stichproben und werden mit Szenarien mit wenigen oder null Schüssen konfrontiert. In diesem Fall führen wir eine Beziehungsextraktion durch Die Kernidee besteht darin, eine externe Wissensbasis einzuführen, um das durch verschiedene semantische Räume verursachte Leistungsverschlechterungsproblem zu lösen Es wurde ein Modul zur Wahrnehmung subtiler Unterschiede entwickelt.
Graphfusion bezeichnet die Zusammenführung von Informationen zwischen Graphen in verschiedenen Geschäftsfeldern.
Vorteile der Graphfusion:
Ein zentraler technischer Punkt im Knowledge-Graph-Fusion-Prozess ist die Entitätsausrichtung. Hier verwenden wir den SOTA-Algorithmus BERT-INT, der hauptsächlich zwei Module umfasst, eines ist das Präsentationsmodul und das andere ist das Interaktionsmodul.
Der Implementierungsprozess des Algorithmus umfasst hauptsächlich Rückruf und Sortierung:
Rückruf: Im Darstellungsmodul wird der BERT-Vektorähnlichkeitsrückruf des Titeltextes verwendet.
Ranking-Modell basierend auf Titel + Attribut + Nachbar: ü Verwenden Sie das Darstellungsmodul, um die Vektordarstellung von Titel, Attribut und Nachbar zu vervollständigen:
In diesem Teil wird hauptsächlich das interne Wissensrepräsentations-Lernframework von Ant vorgestellt.
Ant schlug ein Wissensrepräsentationslernen basierend auf dem Encoder-Decoder-Framework vor. Unter diesen handelt es sich bei Encoder um einige graphische neuronale Lernmethoden und Decoder um einige Methoden zum Wissensrepräsentationslernen, wie z. B. Linkvorhersage. Dieses Repräsentationslern-Framework kann die Produktion universeller Entitäts-/Beziehungseinbettungen selbst überwachen, was mehrere Vorteile hat: 1) Die Einbettungsgröße ist viel kleiner als der ursprüngliche Merkmalsraum, wodurch die Speicherkosten gesenkt werden das Problem der Datenspärlichkeit; 3) Das Lernen im selben Vektorraum macht die Fusion heterogener Daten aus mehreren Quellen natürlicher. 4) Die Einbettung hat eine gewisse Universalität und ist praktisch für die nachgelagerte Geschäftsnutzung.
Als nächstes werde ich einige typische Anwendungsfälle von Wissensgraphen in der Ant Group vorstellen.
Bevor wir spezifische Fälle vorstellen, stellen wir zunächst verschiedene Modi der Szenarioanwendung des Ant Knowledge Graph vor, die hauptsächlich Wissenserwerb, Wissensmanagement und -schlussfolgerung sowie Wissensdienste umfassen. Wie unten gezeigt. 2. Einige typische Fälle Die Schwachstellen sind:
Dieses Szenario ist ein Szenario für Verbraucher-Coupon-Empfehlungen, mit denen das Unternehmen konfrontiert ist:
Um die oben genannten Probleme zu lösen, haben wir einen Deep-Vector-Recall-Algorithmus entwickelt, der die dynamische Diagrammdarstellung verschmilzt. Da wir festgestellt haben, dass das Verhalten von Benutzerverbrauchsgutscheinen zyklisch ist, kann eine statische Einzelkante dieses zyklische Verhalten nicht modellieren. Zu diesem Zweck haben wir zunächst ein dynamisches Diagramm erstellt und dann den vom Team selbst entwickelten dynamischen Diagrammalgorithmus verwendet, um die Einbettungsdarstellung zu erlernen. Nachdem wir die Darstellung erhalten haben, haben wir sie zum Vektorabruf in das Zwillingsturmmodell eingefügt.
Im letzten Fall geht es um die Argumentation von Diagrammregeln. Am Beispiel der Krankenversicherungs-Gesundheitskarte umfasst sie medizinisches Wissen, Schadensregeln und „Personen“-Gesundheitsinformationen, die mit Entitäten verknüpft und mit logischen Regeln als Entscheidungsgrundlage gekoppelt sind. Durch die Karte wurde die Effizienz der Schadenregulierung durch Sachverständige verbessert.
Lassen Sie uns abschließend kurz die Möglichkeiten von Wissensdiagrammen im Kontext der aktuellen rasanten Entwicklung großer Modelle diskutieren.
Wissensgraphen und große Modelle haben jeweils ihre eigenen Vor- und Nachteile. Die Hauptvorteile großer Modelle sind allgemeine Wissensmodellierung und Universalität, während die Nachteile großer Modelle sind Modelle sind genau richtig. Dies kann durch die Vorteile des Wissensgraphen ausgeglichen werden. Zu den Vorteilen der Karte gehören eine hohe Genauigkeit und eine gute Interpretierbarkeit. Große Modelle und Wissensgraphen können sich gegenseitig beeinflussen.
Es gibt normalerweise drei Wege zur Integration von Diagrammen und großen Modellen. Der eine besteht darin, Wissensgraphen zu verwenden, um große Modelle zu verbessern. Der dritte besteht darin, mit großen Modellen zusammenzuarbeiten und Wissensgraphen, ergänzende Vorteile, das große Modell kann als parametrisierte Wissensbasis betrachtet werden, und der Wissensgraph kann als angezeigte Wissensbasis betrachtet werden. 2. Anwendungsfälle von großen Modellen und Wissensgraphen Relationales Denken.
In der ersten Phase wollen wir Finden Sie die im Text vorhandenen Entitäten, Beziehungen oder Ereignistypen, um den Suchraum und die Rechenkomplexität zu reduzieren.
In der zweiten Stufe extrahieren wir weitere relevante Informationen basierend auf den zuvor extrahierten Typen und der gegebenen entsprechenden Liste.
Integrieren Sie den Wissensgraphen in das Training großer Modelle. Beispielsweise können zwei Aufgaben gleichzeitig trainiert werden. Der Wissensgraph kann für Wissensdarstellungsaufgaben verwendet werden, und das große Modell kann für das Vortraining von MLM verwendet werden, und beide werden gemeinsam modelliert.
Injizieren Sie einen Wissensgraphen in die Argumentation großer Modelle. Erstens können zwei Probleme mit großen Modellen gelöst werden. Das eine besteht darin, den Wissensgraphen als a priori-Einschränkungen zu verwenden, um den „Unsinn“ großer Modelle zu vermeiden. Andererseits können basierend auf Wissensgraphen interpretierbare Lösungen für die Generierung großer Modelle bereitgestellt werden.
Die eine ist das wissensgraphengestützte Q&A-System, das ein großes Modell zur Optimierung des KBQA-Modells verwendet; die andere ist die Verbesserung des Informationsabrufs, ähnlich wie LangChain, GopherCite , und New Bing Verwenden Sie große Modelle, um Wissensdatenbankfragen und -antworten zu formulieren.
Das wissensgestützte generative Such-Frage- und Antwortsystem bietet folgende Vorteile:
Wie Wissensgraphen und große Modelle besser interagieren und zusammenarbeiten können, einschließlich der folgenden drei Richtungen:
Das obige ist der detaillierte Inhalt vonJia Qianghuai: Konstruktion und Anwendung eines groß angelegten Wissensgraphen von Ameisen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!