Heim > Artikel > Technologie-Peripheriegeräte > Nach Abschluss der vollständigen Evaluierung von GPT-4 hieß es in Microsofts Hot Paper, dass die erste Version von AGI bald verfügbar sei
1956 wurde auf einem Seminar am Dartmouth College das Konzept der künstlichen Intelligenz offiziell vorgeschlagen. Seitdem ist der Begriff für Psychologen, Philosophen und Informatiker eine Herausforderung, weil er so schwer zu definieren ist. Im Jahr 1994 veröffentlichten 52 Psychologen eine gemeinsame Arbeit, in der sie versuchten, das Wesentliche zu erfassen.
Mit der Zeit richteten die Forscher ihre Aufmerksamkeit auf KI-Systeme in bestimmten Bereichen, wie zum Beispiel bei der AlphaGo-Herausforderung 2016 für den koreanischen Schachmeister und einem großen Sieg . Dann, in den späten 1990er und frühen 2000er Jahren, gaben sich Forscher mit spezialisierter KI nicht mehr zufrieden, sodass der Ruf nach der Entwicklung allgemeinerer Systeme der künstlichen Intelligenz immer lauter wurde. Gleichzeitig begann in den frühen 2000er-Jahren der Begriff „Artificial General Intelligence“ (AGI) an Popularität zu gewinnen.
In letzter Zeit sind, wie Sie sehen, große Sprachmodelle (LLM) ins Rampenlicht gerückt, die auf der Transformer-Architektur basieren und eine große Leistung erbringen Mengen an Textdatensätzen trainiert. Insbesondere die neueste Version von GPT-4 von OpenAI demonstriert die Vielseitigkeit großer Sprachmodelle und beherrscht Mathematik, Schreiben, Recht, Medizin und andere Bereiche.
Wir kommen nicht umhin zu fragen: Ist GPT-4 ein wichtiger Schritt in Richtung AGI?
Die Antwort von Microsoft lautet „Ja“, und in einem kürzlich veröffentlichten Artikel haben sie diesen Standpunkt näher erläutert. Dieser Artikel bietet eine umfassende Bewertung von GPT-4. Microsoft ist der Ansicht, dass „angesichts der Breite und Tiefe der Fähigkeiten von GPT-4 es vernünftigerweise als eine frühe (aber noch unvollständige) Version eines Systems der künstlichen allgemeinen Intelligenz (AGI) betrachtet werden sollte.“ 🎜 🎜#Microsoft sagte außerdem: „Das Hauptziel dieses Artikels besteht darin, die Fähigkeiten und Grenzen von GPT-4 zu erkunden. Wir glauben, dass die Intelligenz von GPT-4 einen echten Paradigmenwechsel in der Informatik und anderen Bereichen darstellt.“ .“
Interessanterweise wurden in diesem beliebten Artikel auch viele Streichungen gefunden, sodass jemand die ungekürzte Version des Artikels fand.
In der ungeschnittenen Version enthüllte dieser Blogger auch viele versteckte Details, wie zum Beispiel, dass der interne Name von GPT-4 DV-3 ist, was eigentlich The Hidden ist Der dritte Autor des Papiers wurde später gelöscht; diese Microsoft-Forscher schienen nicht viel über die technischen Details von GPT-4 zu wissen. Darüber hinaus verriet der Blogger auch, dass der Teil über toxische Inhalte bei der Veröffentlichung dieses Artikels gelöscht wurde (um negative Auswirkungen auf OpenAI zu verhindern?).
Für Interessierte haben wir unten den Twitter-Thread des Bloggers eingefügt.
Twitter-Thread: https://twitter.com/DV2559106965076/status/163876943476360 8064# 🎜 🎜## 🎜🎜#
Zurück zum Artikel selbst.
Dem Artikel zufolge ist AGI die spezifische Fähigkeit, zu argumentieren, zu planen, Probleme zu lösen, abstrakt zu denken, komplexe Ideen zu verstehen, schnell zu lernen und aus Erfahrungen zu lernen. Ausgehend von diesen Fähigkeiten werden in der Arbeit interessante Experimente und Auswertungen durchgeführt.
Das Papier ist in 10 Kapitel unterteilt: Kapitel 1 ist der allgemeine Teil; Kapitel 2 stellt die Multimodalität vor, die sich hauptsächlich auf die Generierung visueller Inhalte bezieht Kapitel 5: Interaktion mit der Welt, Kapitel 9: Soziale Auswirkungen; und Schlussfolgerungen.
Lassen Sie uns anhand konkreter Beispiele sehen, ob GPT-4 wirklich in die AGI-Ära eingetreten ist. Multimodale und interdisziplinäre Komposition
Um die Fähigkeit des Modells zu testen, Kunst mit Programmierung zu kombinieren, wurde GPT-4 in der Studie gebeten, „Write a Piece“ zu verwenden Code in Javascript zum Generieren von Zufallsbildern im Kandinsky-Stil. Das erste Bild unten wurde von Wassily Kandinsky erstellt, und das zweite und dritte Bild wurden von GPT-4 bzw. ChatGPT generiert: #🎜🎜 #
Das Folgende ist der GPT-4-Code-Implementierungsprozess:
#🎜🎜 ## 🎜🎜#Visuelle Konzepte verstehen: In dieser Zeichenaufgabe werden Eingabeaufforderungen eingegeben, damit das Modell die Formen der Buchstaben Y, O und H kombinieren kann, um eine Person zu zeichnen. Tatsächlich gibt es während des Trainingsprozesses von GPT-4 kein Verständnis für die Form von Buchstaben. Aus relevanten Trainingsdaten kann nur vage gelernt werden, dass Buchstaben mit bestimmten Formen zusammenhängen. 4 sind nicht schlecht:Für Skizzengenerierung: GPT-4 kann auch mit stabiler Diffusion kombiniert werden. Das Bild unten ist ein Screenshot der 3D-Stadtmodellierung. Die Eingabeaufforderung zeigt einen Fluss, der von links nach rechts fließt, eine Wüste mit Pyramiden neben dem Fluss und vier Schaltflächen am unteren Bildschirmrand, deren Farben grün sind. blau, braun und rot. Das Folgende ist das generierte Ergebnis:
Sie können GPT-4 auch bitten, Melodien in ABC-Notation zu generieren und zu ändern :
Programmierfähigkeit
GPT-4 verfügt über sehr leistungsstarke Programmierfunktionen, einschließlich entsprechender zu Anweisungen zum Schreiben von Code und zum Verstehen von vorhandenem Code. Die Studie testete speziell die Programmierfähigkeiten von GPT-4.
Code schreiben
Abbildung 3.1 unten ist ein GPT - 4 Beispiele für das Schreiben von Python-Funktionen. In dieser Studie wird LeetCode verwendet, um festzustellen, ob der Code online korrekt ist. Die Forschung ermöglichte dann einen Anstieg von GPT-4. Die Genauigkeitsdaten zu LeetCode in Tabelle 2 werden als Diagramm dargestellt und die Ergebnisse sind in Abbildung 3.2 unten dargestellt.Frontend-/Spieleentwicklung
# 🎜🎜#
Wie in Abbildung 3.3 unten gezeigt, ermöglicht diese Studie GPT-4 die Verwendung von JavaScript zum Schreiben von 3D-Spielen in HTML. GPT-4 generiert ein Spiel, das alle Anforderungen erfüllt mit Null-Samples.Deep-Learning-Programmierung
#🎜 🎜#Das Schreiben von Code für Deep Learning erfordert Kenntnisse in Mathematik, Statistik und Vertrautheit mit Frameworks und Bibliotheken wie PyTorch, TensorFlow und Keras. Wie in Abbildung 3.4 unten dargestellt, benötigen Forscher GPT-4 und ChatGPT, um benutzerdefinierte Optimierungsmodule zu schreiben, eine Aufgabe, die auch für menschliche Deep-Learning-Experten eine Herausforderung darstellt. Forscher stellen Beschreibungen in natürlicher Sprache für GPT-4 und ChatGPT bereit, die eine Reihe wichtiger Vorgänge wie die Anwendung von SVD usw. umfassen.
Darüber hinaus wurde in der Studie auch die Fähigkeit von GPT-4 getestet, Codes in LaTex-Formeln umzuwandeln sind wie folgt Wie in 3.5 gezeigt.
In Bezug auf das Verständnis von Code versucht diese Forschung, GPT-4 und ChatGPT ein C/C++-Programm „lesen“ zu lassen und die Leistung der beiden wie folgt vorherzusagen: # 🎜🎜## 🎜🎜#
Die Studie forderte dann GPT-4 auf, einen Teil des Python-Codes zu interpretieren: 🎜🎜## 🎜🎜#Es gibt auch einen Pseudocode zur Erklärung:
MATHEMATISCHE FÄHIGKEIT#🎜 🎜# Es schien immer, dass die mathematischen Fähigkeiten großer Sprachmodelle nicht sehr gut waren. Wie schlägt sich GPT-4 in dieser Hinsicht? Nach einer Reihe von Bewertungen in diesem Artikel zeigen die Ergebnisse, dass GPT-4 im Vergleich zu früheren Modellen einen qualitativen Sprung in der Mathematik gemacht hat, aber noch weit vom Expertenniveau entfernt ist und nicht über die Fähigkeit verfügt, mathematische Forschung zu betreiben.
Im Vergleich zu ChatGPT hat GPT-4 die Lösung erfolgreich generiert, während ChatGPT die falsche Antwort generiert hat: #🎜 🎜##🎜 🎜#Vergleichsergebnisse von GPT-4 vs. ChatGPT zu AP-Problemen. GPT-4 verwendet den richtigen Ansatz, aber ein Berechnungsfehler führt zu einer falschen Endantwort, während ChatGPT ein inkohärentes Argument liefert.
Darüber hinaus testet dieser Artikel auch die Fähigkeit von GPT-4, mathematisches Denken und Technologie zur Lösung realer Probleme einzusetzen Probleme: Weiter Die Abbildung zeigt, wie GPT-4 erfolgreich ein vernünftiges mathematisches Modell für ein komplexes System erstellt, das umfassende interdisziplinäre Kenntnisse erfordert, während ChatGPT keine sinnvollen Fortschritte erzielt.
Da der Artikel 154 Seiten lang ist, zeigt dieser Artikel nur dann eine große Anzahl an Bewertungsergebnissen an, wenn Sie möchten Weitere Informationen finden Leser im Originalpapier.
Fügen Sie abschließend das Inhaltsverzeichnis hinzu:
#🎜 🎜#
Das obige ist der detaillierte Inhalt vonNach Abschluss der vollständigen Evaluierung von GPT-4 hieß es in Microsofts Hot Paper, dass die erste Version von AGI bald verfügbar sei. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!