Heim > Artikel > Technologie-Peripheriegeräte > Verantwortungsvolles maschinelles Lernen – der „Glasbox“-Ansatz
Übersetzer |. Cui Hao
Rezensent |.Eröffnung
Es gibt andere Arten des maschinellen Lernens (einige beinhalten tiefe neuronale Netze), und die Modellergebnisse dieser Art des maschinellen Lernens, die Bestimmung des Modells und die Komplexität, die sich auf das Modell auswirkt, sind alle sehr transparent.
All dies hängt davon ab, wie gut die Organisation die Quelle ihrer Daten versteht.
Mit anderen Worten: Sie müssen alles verstehen, von Modelltrainingsdaten bis hin zu Produktionsdatenmodellen. Es ist auch ein wesentlicher Bestandteil bei der Interpretation, Verfeinerung und Verbesserung der Ergebnisse. Auf diese Weise können Unternehmen den Geschäftswert ihrer Modelle erheblich steigern.
Noch wichtiger ist, dass es die Fairness, Verantwortlichkeit und Transparenz dieser Technologie weiter verbessert und sie zuverlässiger und vollständiger für die gesamte Gesellschaft macht.
Databricks VP of Marketing Joel Minnick gibt zu: „Deshalb benötigen Sie ein detailliertes Verständnis Ihrer vor- und nachgelagerten Daten, um maschinelles Lernen verantwortungsvoll durchführen zu können.“ umfassen mehrere Technologien wie Datenquellen, Datenkonvertierung und Datenintegration. In einer ausgereiften Datenkataloglösung kann eine Datenerfassung in Echtzeit erreicht werden, sodass der Fortschritt jederzeit überwacht werden kann, um den Ausführungsfortschritt des Modells zu verstehen. „Es gibt mir ein klares Verständnis für den Kontext der Verwendung der Daten im Modell. Außerdem wissen Sie, woher diese Daten stammen? Welche anderen Daten haben wir daraus erhalten? Wann wurden sie generiert? So kann ich sie besser verstehen.“ wie ich diese Daten nutzen soll“, sagte Datenwissenschaftler Minnick.
„Data Lineage“ (Aufzeichnung von Datenquellen, Bewegung und Verarbeitung) besteht aus Metadaten, und das Datenverzeichnis wird zum Speichern relevanter Datensätze verwendet. Kataloge ermöglichen es Benutzern außerdem, Tags und andere Deskriptoren als zusätzliche Metadaten einzuschließen, was dabei helfen kann, die Herkunft der Daten zu verfolgen und Vertrauen in die Daten aufzubauen. „Data Lineage“, wie Minnick es beschreibt, kann „API-gesteuerte Dienste“ generieren, die eine Reihe von Plattformen verbinden (einschließlich Plattformen für Datenwissenschaftler, Plattformen für Dateningenieure und Plattformen für Endbenutzer).
Die verbesserte Nachverfolgbarkeit von Datentraining und Datenoperationen wird sich auf die Ergebnisse von Modellen für maschinelles Lernen auswirken, und die Modellergebnisse stehen in engem Zusammenhang mit der Data Governance im Bereich Data Science. Daher ist Data Governance untrennbar mit der Data-Science-Plattform verbunden, die zum Erstellen und Bereitstellen von Modellen verwendet wird. „Skills verwalten Tabellenkalkulationen und Dateien, verwalten Notizbücher und verwalten gleichzeitig Dashboards. Das ist die moderne Art, Produktions- und Verbrauchsdaten zu verwalten“, kommentierte Minnick. Diese Aussage gilt für Datenwissenschaftler, die Modelle in ihren Notebooks erstellen und die Ausgabe über Dashboards überwachen.
Klar und transparent
Logischerweise kann dieses Wissen genutzt werden, um zu verstehen, warum es Probleme mit bestimmten Datentypen gibt, und diese so zu korrigieren oder die Genauigkeit des Modells zu verbessern, indem man sie vollständig beseitigt. Laut Minnick erkennen immer mehr Unternehmen die Vorteile der Anwendung von „Data Lineage“ auf Modellergebnisse, „was zum Teil auf die zunehmende Verbreitung von maschinellem Lernen und künstlicher Intelligenz in verschiedenen Branchen zurückzuführen ist.“ Bei unserem AutoML-Produkt haben wir letztes Jahr eine „Glasbox“ verwendet, um Transparenz in Datenquellen darzustellen Funktionen zur Einhaltung gesetzlicher Vorschriften. Branchen wie das Finanz- und Gesundheitswesen sind stark reguliert und erfordern von Unternehmen eine klare Erklärung, wie sie Entscheidungen für ihre Kunden treffen. Durch die Rückverfolgbarkeit der Daten entsteht eine Roadmap für die Erstellung von Modellen für maschinelles Lernen und das Verständnis der Modellergebnisse – von unschätzbarem Wert für die Einhaltung gesetzlicher Vorschriften.
Cui Hao, 51CTO-Community-Redakteur und leitender Architekt, verfügt über 18 Jahre Erfahrung in der Softwareentwicklung und Architektur sowie 10 Jahre Erfahrung in verteilter Architektur. Ehemals technischer Experte bei HP. Er ist bereit zu teilen und hat viele beliebte Fachartikel geschrieben, die mehr als 600.000 Mal gelesen wurden. Autor von „Distributed Architecture Principles and Practice“.
Originaltitel: Ein „Glass Box“-Ansatz für verantwortungsvolles maschinelles Lernen# 🎜🎜#, Autor: Jelani Harper
Das obige ist der detaillierte Inhalt vonVerantwortungsvolles maschinelles Lernen – der „Glasbox“-Ansatz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!