suchen
HeimTechnologie-PeripheriegeräteKIHat OpenAI einen Weg gefunden, das größte Hindernis bei der Implementierung von KI zu lösen?

OpenAI scheint eine Lösung für den „schwerwiegenden Unsinn“ der generativen künstlichen Intelligenz gefunden zu haben.

Am 31. Mai gab OpenAI auf seiner offiziellen Website bekannt, dass es ein Modell trainiert hat, das dabei helfen kann, häufige „Illusionen“ und andere häufige Probleme in der generativen KI zu beseitigen.

OpenAI gab an, dass Belohnungsmodelle trainiert werden können, um Halluzinationen zu erkennen, und dass Belohnungsmodelle in Ergebnisüberwachungsmodelle (Feedback auf der Grundlage des Endergebnisses) und Prozessüberwachungsmodelle (Feedback für jeden Schritt in der Denkkette) unterteilt werden.

Das heißt, die Prozessüberwachung belohnt jeden richtigen Schritt in der Argumentation, während die Ergebnisüberwachung lediglich richtige Antworten belohnt.

OpenAI sagt, dass die Prozessüberwachung im Gegensatz dazu einen wichtigen Vorteil hat – Sie trainiert das Modell direkt, um vom Menschen genehmigte Gedankenketten zu erzeugen :

Die Prozessüberwachung bietet im Vergleich zur Ergebnisüberwachung mehrere Konsistenzvorteile. Jeder Schritt wird genau überwacht, sodass Verhalten belohnt wird, das einem konsistenten Gedankenkettenmodell folgt.

Die Prozessüberwachung führt auch eher zu erklärbaren Überlegungen, da sie das Modell dazu ermutigt, einem vom Menschen genehmigten Prozess zu folgen

Ergebnisüberwachung kann einen inkonsistenten Prozess belohnen und ist oft schwieriger zu überprüfen.

OpenAI testete beide Modelle anhand eines mathematischen Datensatzes und stellte fest, dass der Prozessüberwachungsansatz zu einer „deutlich besseren Leistung“ führte.

Hat OpenAI einen Weg gefunden, das größte Hindernis bei der Implementierung von KI zu lösen?

Aber es ist wichtig zu beachten, dass der Prozessüberwachungsansatz bisher nur im mathematischen Bereich getestet wurde und noch mehr Arbeit erforderlich ist, um zu sehen, wie er allgemeiner funktioniert.

Darüber hinaus hat OpenAI nicht angegeben, wie lange es dauern wird, bis diese Forschung auf ChatGPT angewendet wird, das sich noch im Forschungsstadium befindet.

Während die ersten Ergebnisse gut sind, erwähnt OpenAI, dass der sicherere Ansatz eine verringerte Leistung mit sich bringt, die als Alignment-Steuer bezeichnet wird.

Aktuelle Ergebnisse zeigen, dass die Prozessüberwachung bei der Bearbeitung mathematischer Probleme keine Ausrichtungssteuern generiert, die Situation in der allgemeinen Information ist jedoch noch nicht bekannt.

Die „Illusion“ der generativen KI

Seit dem Aufkommen der generativen KI sind die Vorwürfe, falsche Informationen zu fabrizieren und „Halluzinationen zu erzeugen“, nie verschwunden. Dies ist auch eines der größten Probleme aktueller generativer KI-Modelle.

Im Februar dieses Jahres brachte Google als Reaktion auf das von Microsoft finanzierte ChatGPT hastig den Chatbot Bard auf den Markt. Es stellte sich jedoch heraus, dass bei der Demonstration gesunde Menschenverstandfehler gemacht wurden, was dazu führte, dass der Aktienkurs von Google einbrach.

Es gibt viele Gründe für KI-Halluzinationen. Einer davon ist die Eingabe von Daten, um das KI-Programm zu einer Fehlklassifizierung zu verleiten.

Entwickler verwenden beispielsweise Daten (wie Bilder, Text oder andere Arten), um Systeme der künstlichen Intelligenz zu trainieren. Wenn die Daten geändert oder verzerrt werden, interpretiert die Anwendung die Eingabe anders und liefert falsche Ergebnisse.

Illusion kann in großen sprachbasierten Modellen wie ChatGPT aufgrund einer falschen Konverter-Dekodierung auftreten, was dazu führt, dass das Sprachmodell möglicherweise eine Geschichte oder Erzählung erzeugt, die nicht unlogisch oder mehrdeutig ist.

Das obige ist der detaillierte Inhalt vonHat OpenAI einen Weg gefunden, das größte Hindernis bei der Implementierung von KI zu lösen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Dieser Artikel ist reproduziert unter:搜狐. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen
Was ist Denkdiagramm in der schnellen IngenieurwesenWas ist Denkdiagramm in der schnellen IngenieurwesenApr 13, 2025 am 11:53 AM

Einführung In prompt Engineering bezieht sich „Graph of Denk“ auf einen neuartigen Ansatz, der die Grafik Theorie verwendet, um die Argumentationsprozess von AI zu strukturieren und zu leiten. Im Gegensatz zu herkömmlichen Methoden, bei denen es sich häufig um lineare handelt

Optimieren Sie die E -Mail -Marketing Ihres Unternehmens mit Genai -AgentenOptimieren Sie die E -Mail -Marketing Ihres Unternehmens mit Genai -AgentenApr 13, 2025 am 11:44 AM

Einführung Glückwunsch! Sie führen ein erfolgreiches Geschäft. Über Ihre Webseiten, Social -Media -Kampagnen, Webinare, Konferenzen, kostenlose Ressourcen und andere Quellen sammeln Sie täglich 5000 E -Mail -IDs. Der nächste offensichtliche Schritt ist

Echtzeit-App-Leistungsüberwachung mit Apache PinotEchtzeit-App-Leistungsüberwachung mit Apache PinotApr 13, 2025 am 11:40 AM

Einführung In der heutigen schnelllebigen Softwareentwicklungsumgebung ist die Gewährleistung einer optimalen Anwendungsleistung von entscheidender Bedeutung. Die Überwachung von Echtzeitmetriken wie Antwortzeiten, Fehlerraten und Ressourcenauslastung kann die Hauptstufe unterstützen

Chatgpt trifft 1 Milliarde Benutzer? 'In nur wenigen Wochen verdoppelt', sagt OpenAI -CEOChatgpt trifft 1 Milliarde Benutzer? 'In nur wenigen Wochen verdoppelt', sagt OpenAI -CEOApr 13, 2025 am 11:23 AM

"Wie viele Benutzer haben Sie?" er stapte. "Ich denke, das letzte Mal, als wir sagten, wächst 500 Millionen wöchentliche Wirkstoffe, und es wächst sehr schnell", antwortete Altman. "Du hast mir gesagt, dass es sich in nur wenigen Wochen verdoppelt hat", fuhr Anderson fort. „Ich habe das Privat gesagt

Pixtral -12b: Mistral AIs erstes multimodales Modell - Analytics VidhyaPixtral -12b: Mistral AIs erstes multimodales Modell - Analytics VidhyaApr 13, 2025 am 11:20 AM

Einführung Mistral hat sein erstes multimodales Modell veröffentlicht, nämlich den Pixtral-12b-2409. Dieses Modell basiert auf dem 12 -Milliarden -Parameter von Mistral, NEMO 12b. Was unterscheidet dieses Modell? Es kann jetzt sowohl Bilder als auch Tex aufnehmen

Agentenrahmen für generative KI -Anwendungen - Analytics VidhyaAgentenrahmen für generative KI -Anwendungen - Analytics VidhyaApr 13, 2025 am 11:13 AM

Stellen Sie sich vor, Sie hätten einen AS-Assistenten mit KI, der nicht nur auf Ihre Abfragen reagiert, sondern auch autonom Informationen sammelt, Aufgaben ausführt und sogar mehrere Arten von Daten ausführt-Text, Bilder und Code. Klingt futuristisch? In diesem a

Anwendungen der Generativen KI im FinanzsektorAnwendungen der Generativen KI im FinanzsektorApr 13, 2025 am 11:12 AM

Einführung Die Finanzbranche ist der Eckpfeiler der Entwicklung eines Landes, da sie das Wirtschaftswachstum fördert, indem sie effiziente Transaktionen und Kreditverfügbarkeit erleichtert. Die Leichtigkeit, mit der Transaktionen auftreten und Krediten auftreten

Leitfaden für Online-Lernen und passiv-aggressive AlgorithmenLeitfaden für Online-Lernen und passiv-aggressive AlgorithmenApr 13, 2025 am 11:09 AM

Einführung Daten werden mit beispielloser Geschwindigkeit aus Quellen wie Social Media, Finanztransaktionen und E-Commerce-Plattformen generiert. Der Umgang mit diesem kontinuierlichen Informationsstrom ist eine Herausforderung, aber sie bietet eine

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

MantisBT

MantisBT

Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

DVWA

DVWA

Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

SecLists

SecLists

SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.