


Hat OpenAI einen Weg gefunden, das größte Hindernis bei der Implementierung von KI zu lösen?
OpenAI scheint eine Lösung für den „schwerwiegenden Unsinn“ der generativen künstlichen Intelligenz gefunden zu haben.
Am 31. Mai gab OpenAI auf seiner offiziellen Website bekannt, dass es ein Modell trainiert hat, das dabei helfen kann, häufige „Illusionen“ und andere häufige Probleme in der generativen KI zu beseitigen.
OpenAI gab an, dass Belohnungsmodelle trainiert werden können, um Halluzinationen zu erkennen, und dass Belohnungsmodelle in Ergebnisüberwachungsmodelle (Feedback auf der Grundlage des Endergebnisses) und Prozessüberwachungsmodelle (Feedback für jeden Schritt in der Denkkette) unterteilt werden.
Das heißt, die Prozessüberwachung belohnt jeden richtigen Schritt in der Argumentation, während die Ergebnisüberwachung lediglich richtige Antworten belohnt.
OpenAI sagt, dass die Prozessüberwachung im Gegensatz dazu einen wichtigen Vorteil hat – Sie trainiert das Modell direkt, um vom Menschen genehmigte Gedankenketten zu erzeugen :
Die Prozessüberwachung bietet im Vergleich zur Ergebnisüberwachung mehrere Konsistenzvorteile. Jeder Schritt wird genau überwacht, sodass Verhalten belohnt wird, das einem konsistenten Gedankenkettenmodell folgt.
Die Prozessüberwachung führt auch eher zu erklärbaren Überlegungen, da sie das Modell dazu ermutigt, einem vom Menschen genehmigten Prozess zu folgen
Ergebnisüberwachung kann einen inkonsistenten Prozess belohnen und ist oft schwieriger zu überprüfen.
OpenAI testete beide Modelle anhand eines mathematischen Datensatzes und stellte fest, dass der Prozessüberwachungsansatz zu einer „deutlich besseren Leistung“ führte.
Darüber hinaus hat OpenAI nicht angegeben, wie lange es dauern wird, bis diese Forschung auf ChatGPT angewendet wird, das sich noch im Forschungsstadium befindet.
Während die ersten Ergebnisse gut sind, erwähnt OpenAI, dass der sicherere Ansatz eine verringerte Leistung mit sich bringt, die als Alignment-Steuer bezeichnet wird.
Aktuelle Ergebnisse zeigen, dass die Prozessüberwachung bei der Bearbeitung mathematischer Probleme keine Ausrichtungssteuern generiert, die Situation in der allgemeinen Information ist jedoch noch nicht bekannt.
Die „Illusion“ der generativen KI
Seit dem Aufkommen der generativen KI sind die Vorwürfe, falsche Informationen zu fabrizieren und „Halluzinationen zu erzeugen“, nie verschwunden. Dies ist auch eines der größten Probleme aktueller generativer KI-Modelle.
Im Februar dieses Jahres brachte Google als Reaktion auf das von Microsoft finanzierte ChatGPT hastig den Chatbot Bard auf den Markt. Es stellte sich jedoch heraus, dass bei der Demonstration gesunde Menschenverstandfehler gemacht wurden, was dazu führte, dass der Aktienkurs von Google einbrach.
Es gibt viele Gründe für KI-Halluzinationen. Einer davon ist die Eingabe von Daten, um das KI-Programm zu einer Fehlklassifizierung zu verleiten.
Entwickler verwenden beispielsweise Daten (wie Bilder, Text oder andere Arten), um Systeme der künstlichen Intelligenz zu trainieren. Wenn die Daten geändert oder verzerrt werden, interpretiert die Anwendung die Eingabe anders und liefert falsche Ergebnisse.
Illusion kann in großen sprachbasierten Modellen wie ChatGPT aufgrund einer falschen Konverter-Dekodierung auftreten, was dazu führt, dass das Sprachmodell möglicherweise eine Geschichte oder Erzählung erzeugt, die nicht unlogisch oder mehrdeutig ist.
Das obige ist der detaillierte Inhalt vonHat OpenAI einen Weg gefunden, das größte Hindernis bei der Implementierung von KI zu lösen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Einführung In prompt Engineering bezieht sich „Graph of Denk“ auf einen neuartigen Ansatz, der die Grafik Theorie verwendet, um die Argumentationsprozess von AI zu strukturieren und zu leiten. Im Gegensatz zu herkömmlichen Methoden, bei denen es sich häufig um lineare handelt

Einführung Glückwunsch! Sie führen ein erfolgreiches Geschäft. Über Ihre Webseiten, Social -Media -Kampagnen, Webinare, Konferenzen, kostenlose Ressourcen und andere Quellen sammeln Sie täglich 5000 E -Mail -IDs. Der nächste offensichtliche Schritt ist

Einführung In der heutigen schnelllebigen Softwareentwicklungsumgebung ist die Gewährleistung einer optimalen Anwendungsleistung von entscheidender Bedeutung. Die Überwachung von Echtzeitmetriken wie Antwortzeiten, Fehlerraten und Ressourcenauslastung kann die Hauptstufe unterstützen

"Wie viele Benutzer haben Sie?" er stapte. "Ich denke, das letzte Mal, als wir sagten, wächst 500 Millionen wöchentliche Wirkstoffe, und es wächst sehr schnell", antwortete Altman. "Du hast mir gesagt, dass es sich in nur wenigen Wochen verdoppelt hat", fuhr Anderson fort. „Ich habe das Privat gesagt

Einführung Mistral hat sein erstes multimodales Modell veröffentlicht, nämlich den Pixtral-12b-2409. Dieses Modell basiert auf dem 12 -Milliarden -Parameter von Mistral, NEMO 12b. Was unterscheidet dieses Modell? Es kann jetzt sowohl Bilder als auch Tex aufnehmen

Stellen Sie sich vor, Sie hätten einen AS-Assistenten mit KI, der nicht nur auf Ihre Abfragen reagiert, sondern auch autonom Informationen sammelt, Aufgaben ausführt und sogar mehrere Arten von Daten ausführt-Text, Bilder und Code. Klingt futuristisch? In diesem a

Einführung Die Finanzbranche ist der Eckpfeiler der Entwicklung eines Landes, da sie das Wirtschaftswachstum fördert, indem sie effiziente Transaktionen und Kreditverfügbarkeit erleichtert. Die Leichtigkeit, mit der Transaktionen auftreten und Krediten auftreten

Einführung Daten werden mit beispielloser Geschwindigkeit aus Quellen wie Social Media, Finanztransaktionen und E-Commerce-Plattformen generiert. Der Umgang mit diesem kontinuierlichen Informationsstrom ist eine Herausforderung, aber sie bietet eine


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Dreamweaver CS6
Visuelle Webentwicklungstools

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

DVWA
Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

SecLists
SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.