Heim >Technologie-Peripheriegeräte >KI >Kann KI-Müdigkeit durch Data Governance gelöst werden?

Kann KI-Müdigkeit durch Data Governance gelöst werden?

王林nach vorne: 2024-01-18 17:51:22884Durchsuche

Data Governance und KI-Müdigkeit mögen wie zwei verschiedene Konzepte klingen, aber die beiden sind untrennbar miteinander verbunden. Um es besser zu verstehen, beginnen wir mit ihrer Definition.

Data Governance

Es ist seit langem ein zentraler Schwerpunkt der Datenbranche.

Data Governance umfasst alle Maßnahmen, um sicherzustellen, dass Daten sicher, privat, genau, verfügbar und zuverlässig sind, einschließlich der Entwicklung interner Standards und Datenrichtlinien zur Regulierung der Erhebung, Speicherung, Verarbeitung und Entsorgung von Daten. Dieser Prozess ist für den Schutz der Privatsphäre der Benutzer und die Wahrung der Datenintegrität von entscheidender Bedeutung.

Wie diese Definition betont, geht es bei Data Governance um die Verwaltung von Daten – genauer gesagt, der Engine, die KI-Modelle antreibt.

Während der Zusammenhang zwischen Data Governance und KI zunächst offensichtlich ist, stellt die Verknüpfung mit KI-Müdigkeit durch die Hervorhebung der Ursachen von Müdigkeit sicher, dass der Begriff im gesamten Artikel konsistent verwendet wird.

KI-Müdigkeit

KI-Müdigkeit kann aufgrund von Rückschlägen und Herausforderungen auftreten, denen ein Unternehmen, ein Entwickler oder ein Team gegenübersteht, was zu einer behinderten Implementierung oder Wertschöpfung von KI-Systemen führt.

Der Hauptgrund für die Überbewertung der KI sind unrealistische Erwartungen an ihre Fähigkeiten. Stakeholder müssen sich über die Fähigkeiten, Möglichkeiten, Grenzen und Risiken der KI im Klaren sein, um ihren Wert und ihre Anwendungen richtig einschätzen zu können.

Wenn es um Risiken geht, wird Ethik oft als zweitrangig betrachtet, was dazu führt, dass nicht konforme KI-Initiativen aufgegeben werden.

Sie fragen sich bestimmt, welche Rolle die Datenverwaltung bei der Entstehung von KI-Müdigkeit spielt – das ist die Prämisse dieses Artikels.

Hierhin gehen wir als nächstes.

KI-Müdigkeit kann grob in die Phasen vor und nach der Bereitstellung unterteilt werden. Konzentrieren wir uns zunächst auf die Arbeit vor der Bereitstellung.

Vorbereitung

Es gibt viele Faktoren, die bei der Aktualisierung eines Proof of Concept (PoC) auf die Bereitstellung eine Rolle spielen, wie zum Beispiel:

Welches Problem versuchen wir zu lösen
Warum ist die Priorisierung jetzt ein so dringendes Problem?
Ja, welche Daten sind verfügbar?
Gibt es Muster in den Daten?
Welche zusätzlichen Daten verbessern die Leistung des Modells?
Sobald wir evaluiert haben, führt das Data-Science-Team eine explorative Datenanalyse durch, um festzustellen, welches Problem am besten mithilfe von ML-Algorithmen gelöst werden kann. In dieser Phase werden viele zugrunde liegende Datenmuster aufgedeckt, die verdeutlichen, ob bestimmte Daten umfangreiche Signale enthalten. Dies hilft auch bei der Erstellung technischer Funktionen, um den Lernprozess des Algorithmus zu beschleunigen.
Als nächstes erstellt das Team das erste Basismodell und stellt häufig fest, dass seine Leistung nicht auf einem akzeptablen Niveau liegt. Ein Modell, dessen Ausgabe so gut ist wie das Werfen einer Münze, bringt keinen Mehrwert. Dies ist einer der ersten Rückschläge und Lehren aus der Entwicklung von ML-Modellen.

Unternehmen können von einem Geschäftsproblem zum nächsten wechseln, was zu Müdigkeit führt. Wenn die zugrunde liegenden Daten jedoch kein reichhaltiges Signal enthalten, kann kein KI-Algorithmus darauf aufgebaut werden, und das Modell muss statistische Zusammenhänge aus den Trainingsdaten lernen, um auf unsichtbare Daten zu verallgemeinern.

Nach der Bereitstellung

Obwohl das trainierte Modell vielversprechende Ergebnisse im Validierungssatz zeigt, kann es dennoch vorkommen, dass das Modell in der Produktionsumgebung auf der Grundlage qualifizierter Geschäftskriterien, wie z. B. 70 % Genauigkeitsmüdigkeit, nicht die richtige Leistung erbringt.

Diese Art der KI-Müdigkeit wird als Post-Deployment-Phase bezeichnet.

Unzählige Gründe können zu Leistungseinbußen führen, und schlechte Datenqualität ist das häufigste Problem des Modells, das die Fähigkeit des Modells einschränkt, Zielreaktionen ohne Schlüsselattribute genau vorherzusagen.

Bedenken Sie, dass eines der wesentlichen Merkmale, das nur in 10 % der Trainingsdaten fehlte, in den Produktionsdaten nun in 50 % der Fälle zu Null wird, was zu falschen Vorhersagen und Bemühungen führt, sicherzustellen, dass das Modell konsistent funktioniert Dies führt dazu, dass Datenwissenschaftler und Geschäftsteams erschöpft sind, was das Vertrauen in die Datenpipeline untergräbt und Projektinvestitionen gefährdet.

Data Governance ist der Schlüssel

Robuste Data Governance-Maßnahmen sind entscheidend, um beiden Arten der KI-Müdigkeit entgegenzuwirken. Da Daten den Kern von ML-Modellen bilden, sind signalreiche, fehlerfreie und qualitativ hochwertige Daten für den Erfolg von ML-Projekten erforderlich. Die Bekämpfung der KI-Müdigkeit erfordert einen starken Fokus auf Daten-Governance. Deshalb müssen wir rigoros daran arbeiten, die richtige Datenqualität sicherzustellen und so den Grundstein für den Aufbau hochmoderner Modelle und die Bereitstellung vertrauenswürdiger Geschäftserkenntnisse zu legen.

Datenqualität

Datenqualität ist der Schlüssel zu einer erfolgreichen Datenverwaltung und ein entscheidender Faktor für den Erfolg von Algorithmen für maschinelles Lernen. Unternehmen müssen in die Datenqualität investieren, beispielsweise durch die Veröffentlichung von Berichten für Datenkonsumenten. Denken Sie bei datenwissenschaftlichen Projekten darüber nach, was passiert, wenn Daten von schlechter Qualität in das Modell eingehen, was zu einer schlechten Leistung führen kann.

Nur während der Fehleranalyse können Teams Datenqualitätsprobleme identifizieren, was letztendlich zu Ermüdung bei den Teams führt, wenn diese Probleme zur Behebung an die Vorgesetzten weitergeleitet werden.

Natürlich ist es nicht nur der Aufwand, der dahintersteckt, sondern es geht auch viel Zeit verloren, bis mit der Eingabe der richtigen Daten begonnen wird.

Daher wird immer empfohlen, Datenprobleme an der Quelle zu beheben, um solche zeitaufwändigen Iterationen zu verhindern. Letztlich implizieren veröffentlichte Datenqualitätsberichte, dass das Data-Science-Team (oder alle anderen nachgeschalteten Benutzer und Datenkonsumenten) die akzeptable Qualität der eingehenden Daten versteht.

Ohne Datenqualitäts- und Governance-Maßnahmen werden Datenwissenschaftler mit Datenproblemen überhäuft, was zu erfolglosen Modellen führt, die zu KI-Müdigkeit führen.

Fazit

Dieser Artikel beleuchtet die beiden Phasen des Beginns der KI-Müdigkeit und beschreibt, wie Data-Governance-Maßnahmen wie Datenqualitätsberichte die Erstellung vertrauenswürdiger und robuster Modelle vorantreiben können.

Durch die Schaffung einer soliden Grundlage durch Data Governance können Unternehmen einen Fahrplan für eine erfolgreiche und nahtlose KI-Entwicklung und -Einführung erstellen und so Begeisterung wecken.

Um sicherzustellen, dass dieser Artikel einen umfassenden Überblick über die verschiedenen Möglichkeiten zum Umgang mit KI-Müdigkeit bietet, betone ich auch die Rolle der Organisationskultur, die in Kombination mit anderen Best Practices wie Data Governance es Data-Science-Teams ermöglichen wird, schneller und effizienter zu arbeiten Erstellen Sie schnell sinnvolle KI-Beiträge.

Das obige ist der detaillierte Inhalt vonKann KI-Müdigkeit durch Data Governance gelöst werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

算法数据分析

Stellungnahme：

Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Cindy Elder: Sam Altman, CEO von OpenAI, spricht über den Energieverbrauch und die regulatorische Haltung von KINächster Artikel：Cindy Elder: Sam Altman, CEO von OpenAI, spricht über den Energieverbrauch und die regulatorische Haltung von KI

In Verbindung stehende Artikel

Mehr sehen