Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Modellverwaltung für maschinelles Lernen: integrierte Modellierung

Modellverwaltung für maschinelles Lernen: integrierte Modellierung

PHPz
PHPznach vorne
2023-05-01 19:13:041156Durchsuche

​Übersetzer | beim Erlernen von Methoden.

Viele Organisationen nutzen bei der Anwendung von maschinellem Lernen fortgeschrittene und klassische Lernmethoden. Es gibt die bekannte Dichotomie zwischen überwachtem und unbeaufsichtigtem Lernen sowie neue Varianten des maschinellen Lernens wie kontrastives Lernen, verstärkendes Lernen und selbstüberwachtes Lernen.

Darüber hinaus sind Graphanalyse, tiefe neuronale Netze, Segmentierung, Verhaltensanalyse und andere Techniken beteiligt. Wie entscheiden Unternehmen, welche Methoden des maschinellen Lernens sie verwenden, wenn sie mit großen, komplexen Geschäftsproblemen konfrontiert werden – etwa der Stärkung von Maßnahmen zur Bekämpfung der Geldwäsche zur Bekämpfung von Finanzkriminalität?

Durch die integrierte Modellierung verliert dieses Problem an Bedeutung. Dieser Ansatz des maschinellen Lernens ermöglicht es Unternehmen, verschiedene Modelle zu nutzen und sie mit Vorhersagegenauigkeit zu kombinieren, um optimale Ergebnisse zu erzielen. Modellverwaltung für maschinelles Lernen: integrierte Modellierung

Dieser Ansatz trägt dazu bei, den vollständigen Kontext für hochdimensionale Daten in den Bereichen Finanzdienstleistungen, Betrugserkennung und Cybersicherheit bereitzustellen. Organisationen, die Ensemble-Modellierung verwenden, sagen, dass „Ensemble-Modellierung mehr Vielfalt bei der Modellbildung ermöglicht“, und Martin Rehak, CEO von Resistance AI, gibt zu: „Wir möchten nicht, dass ein einzelnes Modell hervorsticht.“ ermöglicht es Organisationen, mithilfe verschiedener Algorithmen verschiedene Aspekte eines Geschäftsproblems zu bewerten, um vollständig informierte, konsistente und erklärbare Entscheidungsmethoden einzuführen.

Konsensbasierte Modellentscheidungen

Die zuvor erwähnten Prinzipien der Ensemble-Modellierung sind unbestreitbar. Datenwissenschaftler müssen nicht viel Zeit damit verbringen, perfekte Modelle für Geschäftsfälle zu entwerfen, sondern müssen nur diese unvollständigen Modelle kombinieren, um Vorhersagen zu erstellen . Fähigkeit. „Wenn man maschinelles Lernen in einem Ensemble-Ansatz betrachtet, trifft man Entscheidungen anhand kleiner Algorithmen“, bemerkte Rehak. „Und in unserem Fall werden diese Algorithmen für jeden Handel dynamisch kombiniert, um die beste Entscheidung zu treffen.“ Darüber hinaus könnte sich jedes dieser Modelle auf eine bestimmte Branche spezialisieren, z. B. auf die Identifizierung von Geldwäschevorfällen.

Zum Beispiel konzentriert sich ein Modell nur auf die Größe der Transaktion. Ein anderes Modell konzentriert sich auf den Ort von Transaktionen. Verschiedene Modelle können untersuchen, welche konkreten Teilnehmer an der Transaktion beteiligt waren. Das Ziel sei eine Situation, in der es „keine Spitzen gibt“, erklärt Rehak. „Die Verteilung des Modells ist sehr flach und die dem Modell entsprechende Evidenz ist relativ schwach. Durch die Kombination vieler schwacher Evidenzelemente kann man eine stärkere Entscheidung treffen, indem man durch klassisches maschinelles Lernen und einfachere Modelle weniger Training benötigt.“ Daten (und Anmerkungen) sind erforderlich, um das Modell in Produktion zu bringen. Solche Modelle sind einfacher zu interpretieren als tiefe neuronale Netze, die große Mengen an Trainingsdaten erfordern.

Kontextuelle Modellierung

Es ist wichtig, den von Rehak beschriebenen Ansatz der verteilungsflachen Modellierung von anderen Ensemble-Modellierungstechniken zu unterscheiden. Die häufigsten Beispiele für Ensemble-Modellierung umfassen Bagging oder Boosting (letzteres erfordert möglicherweise Xtreme Gradient Boosting). Random Forest ist ein Beispiel für Boosting, das auf einer Kombination verschiedener Entscheidungsbäume basiert. Bei diesem Ansatz „erstellt man die Sammlung eine nach der anderen auf der Grundlage der vorherigen Versionen in der Sammlung“, kommentiert Rehak. Obwohl dies eine schnelle Möglichkeit ist, Modelle mit hoher Vorhersagegenauigkeit zu erstellen, besteht die Gefahr einer Überanpassung (das Modell wird für Produktionsdaten weniger anwendbar, da der Trainingsdatensatz zu klein ist).

Der integrierte Ansatz von Rehak eignet sich besser für AML-Anwendungsfälle, da er auf dem Kontext basiert, der diese Ereignisse beeinflusst. „Wenn man einen Geldwäscheexperten fragt, ob eine Transaktion böswillig war, schaut er sich zunächst die Kontohistorie an und wie sich die Person in der Vergangenheit verhalten hat“, sagte Rehak. Durch seinen Ansatz werden Faktoren im Zusammenhang mit geografischem Standort, Tageszeit, interessierten Parteien und Finanzinstituten mithilfe separater Modelle des maschinellen Lernens untersucht. Nur durch die Kombination der Ergebnisse jedes dieser Modelle kann das KI-System mit deutlich weniger Fehlalarmen feststellen, ob eine kriminelle Transaktion stattgefunden hat. „Maschinelles Lernen kann die meisten Ausreißer erklären, die sonst die Anti-Geldwäsche-Teams überfordern würden“, sagte Rehak.

Entscheidungsgrenzen

Bei der Integration von Anwendungsfällen zur Modellierung werden üblicherweise über 60 Modelle verwendet, um verschiedene Aspekte der Analysetransaktion zu modellieren. Die Echtzeitergebnisse des integrierten Ansatzes sind für dieses Anwendungsszenario gut geeignet. „Einer dieser 60 Algorithmen kann alles in Segmente aufteilen und dann die durchschnittliche Transaktionsgröße pro Sekunde modellieren“, verrät Rehak. „Wir können Tausende von Clips haben, die gleichzeitig dynamisch aktualisiert werden.“

Mit einer Vielzahl in das Ensemble integrierter Modelle, die jeweils unterschiedliche Aspekte einer Transaktion bewerten, um potenzielles kriminelles Verhalten aufzudecken, kann ein umfassenderer Ansatz nicht geschaffen werden. „Wir betrachten Sie aus so vielen Blickwinkeln, dass es sehr schwierig wird, Ihr Verhalten zu gestalten und Ihnen gleichzeitig zu ermöglichen, all diese kriminellen Handlungen zu vermeiden“, verriet Rehak. „Denn um nicht identifiziert zu werden, muss ein ‚Krimineller‘ ausweichen mehr als eine Entscheidungsgrenze, aber eine große Anzahl dynamischer Entscheidungsgrenzen. Jedes Modell in diesen Algorithmen wird unabhängig gelernt und wir kombinieren sie dann miteinander. Erstens verlassen sie sich nicht zu sehr auf fortgeschrittenes maschinelles Lernen und umfassen nur einfachere, besser interpretierbare Algorithmen (die traditionelles maschinelles Lernen umfassen). Diese Modelle wurden zum Eckpfeiler der Bewertung von Transaktionskriminalität. „Wenn wir sagen, dass etwas wichtig ist, können wir Ihnen sagen, warum“, sagte Rehak. „Wir können Ihnen sagen, welche Indikatoren darauf hinweisen. Wir können für jeden Befund einen Bericht verfassen, der darauf hinweist, dass aufgrund dieser Faktoren ein hohes Risiko für Transaktionskriminalität besteht.“ das Modell. Generell wird Algorithmen mit Graphenanalyse (die sich gut zur Untersuchung von Zusammenhängen eignen) ein größeres Gewicht beigemessen als anderen Modellen.

Modelle können nicht nur verdächtiges Verhalten erklären, sondern Ihnen auch sagen, warum Ausreißer auftreten. „Normalerweise haben wir vier oder fünf dominante Algorithmen in einem Ensemble. Wenn ich also glaube, dass es sich um einen Ausreißer handelt, werden andere aufgrund des Algorithmus dahinter zustimmen“, bemerkte Rehak. „Außerdem haben wir vier oder fünf Auslöser, was garantiert, dass die Ergebnisse etwas in Richtung Anomalien verzerrt sind.“ Da einzelne Modelle nur einen Faktor in einer Transaktion bewerten, bieten sie Interpretierbarkeit und Interpretierbarkeit des Wortes. „Da wir die Menge, die Mikrosegmentierung und das Volumen kennen, können wir diese Informationen einfach mit Fragen neben dem Score anzeigen, und das Volumen ist für die Finanzabteilung eines Unternehmens sehr wichtig“, fügte Rehak hinzu.

Integriertes Muster

Letztendlich übertrifft die Verwendung integrierter Modellierung jede einzelne Anwendung, obwohl sie bei AML-Aktivitäten eine große Hilfe sein kann. Bei richtiger Anwendung kann diese Technologie die Interpretierbarkeit verbessern und gleichzeitig die Menge an Trainingsdaten und Anmerkungen reduzieren, die zur Lösung geschäftskritischer Probleme erforderlich sind.

Integrierte Modellierung nutzt verschiedene datenwissenschaftliche Techniken, um mehrere Geschäftsprobleme zu lösen, anstatt die Probleme auf ein oder zwei zu beschränken. Infolgedessen könnte dieser integrierte Problemlösungsansatz zum Aushängeschild für KI-Einsätze werden.

Übersetzer-Einführung

Cui Hao, 51CTO-Community-Redakteur, leitender Architekt, verfügt über 18 Jahre Erfahrung in der Softwareentwicklung und Architektur sowie 10 Jahre Erfahrung in verteilter Architektur. Ehemals technischer Experte bei HP. Er ist bereit zu teilen und hat viele beliebte Fachartikel geschrieben, die mehr als 600.000 Mal gelesen wurden. Autor von „Prinzipien und Praxis der verteilten Architektur“.

Originaltitel:

​Machine Learning Model Management: Ensemble Modeling​​#🎜 🎜#

Das obige ist der detaillierte Inhalt vonModellverwaltung für maschinelles Lernen: integrierte Modellierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen