Heim >Technologie-Peripheriegeräte >KI >GPT-4 hat schon lange darauf gewartet, die „KI'-Welt erneut zu verändern.
Kürzlich hat der Chatbot mit künstlicher Intelligenz ChatGPT das Internet im Sturm erobert, und die Internetnutzer sind begeistert von seiner extrem hohen emotionalen Intelligenz und enormen Leistungsfähigkeit. Machen Sie die Aufnahmeprüfung für das College, ändern Sie Code, konzipieren Sie Romane ... Unter der „Aufforderung“ der Mehrheit der Internetnutzer bricht es sich immer weiter durch und kann sogar ein ganzes Programm verwenden, um einen Welpen für Sie zusammenzufügen. Diese Fähigkeiten werden nur auf Basis von GPT-3.5 entwickelt. Am 15. März wurde die KI-Welt erneut aktualisiert und die neueste Version von GPT-4 wurde auch von OpenAI veröffentlicht.
Im Vergleich zu früher weist GPT-4 nicht nur ein leistungsfähigeres Sprachverständnis auf, sondern kann auch Bildinhalte verarbeiten und seine Punktzahl in der Prüfung kann sogar 90 % der Menschen übertreffen. Welche anderen Fähigkeiten hat solch ein „herausforderndes“ GPT-4? Wie wird es hergestellt?
Nach der Veröffentlichung von GPT-4 war die offizielle Website von OpenAI vorübergehend überlastet und viele Benutzer äußerten in den sozialen Medien, dass sie den Plus-Dienst sofort abonniert hätten. Nach der Veröffentlichung von GPT-4 tauchte der Begriff „GPT-4“ schnell auf den Hot-Listen in den USA, Japan und anderen Regionen sowie auf der inländischen Weibo-Hot-Search-Liste, der Douyin-Hot-Social-Liste usw. auf.
Laut der offiziellen Einführung von OpenAI ist GPT-4 ein großes multimodales Modell, das Bild- und Texteingaben empfangen und Text ausgeben kann. Obwohl es in vielen realen Szenarien weniger leistungsfähig ist als Menschen, zeigt es bei einer Vielzahl beruflicher und akademischer Benchmarks eine Leistung auf menschlichem Niveau. Beispielsweise kann GPT-4 den simulierten SAT (American Scholastic Aptitude Test) bestehen und die oberen 10 % erreichen, während GPT-3.5 die unteren 10 % erreichen kann.
Wir haben gesehen, dass Open AI-Präsident und Mitbegründer Greg Brockman den Benutzern im offiziellen Demonstrationsvideo auch einen kleinen Einblick in die Bilderkennungsfähigkeiten der neuesten Version des Systems gab, die noch nicht veröffentlicht wurde wird nur von einer Firma namens Be My Eyes Company Testing entwickelt. Mit dieser Funktion kann GPT-4 mit Eingabeaufforderungen übermittelte Bilder analysieren und darauf reagieren sowie Fragen beantworten oder Aufgaben auf der Grundlage dieser Bilder ausführen. „GPT-4 ist nicht nur ein Sprachmodell, es ist ein Visionsmodell“, sagte Brockman. „Es verfügt über die Flexibilität, Eingaben zu akzeptieren, die willkürlich mit Bildern und Text durchsetzt sind, ein bisschen wie ein Dokument.“ Während der Demo übermittelte Greg Brockman ein Foto einer Handzeichnung und eine vorläufige Website-Skizze an GPT-4, und das System erstellte auf Grundlage der Zeichnung eine funktionierende Website.
Die Branche geht davon aus, dass ChatGPT-4 571-mal leistungsfähiger ist als GPT-3. Die drei Hauptberufe, die am meisten von dieser neuesten Errungenschaft profitieren, sind Schriftsteller, Vermarkter und Unternehmer. Basierend auf dem Vergleich zwischen den beiden wiesen Brancheninsider auch darauf hin, dass GPT-4 weitere Vorteile hat, wie zum Beispiel mehr Trainingsdaten, vielfältigere und kreativere Antworten und eine kürzere Reaktionszeit von einer Sekunde.
Wir glauben, dass einer der Haupttrends, die sich in diesem Upgrade widerspiegeln, die Multimodalität ist. Das Modell ist komplexer und umfangreicher geworden, um genauere Vorhersagen über unsere Umgebung zu treffen Gutes Verständnis für die Umwelt und die reale Welt.
Darüber hinaus zeigt GPT-4 auch in puncto Mehrsprachigkeit seine Überlegenheit. Unter den 26 getesteten Sprachen schnitt GPT-4 in 24 Sprachen besser ab als die englische Sprachleistung anderer großer Sprachmodelle wie GPT-3.5, darunter einige ressourcenarme Sprachen wie Lettisch und Walisisch. Im chinesischen Kontext kann GPT-4 eine Genauigkeit von 80,1 % erreichen.
Allerdings hat OpenAI auch die Mängel von GPT-4 auf der offiziellen Website aufgeführt. Es weist immer noch bekannte Einschränkungen auf, darunter soziale Vorurteile, die Fälschung von Fakten und die Entstehung von Konfrontationen. OpenAI erklärte, dass die Gesellschaft mit der Akzeptanz von KI-Modellen die Transparenz erhöhen, die Aufklärung der Benutzer und eine umfassendere Kompetenz im Bereich der künstlichen Intelligenz fördern und fördern und sich bemühen werde, die Eingabekanäle der Menschen bei der Entwicklung von KI-Modellen zu erweitern.
Mit der Entwicklung von GPT-4 haben wir festgestellt, dass seine Fähigkeiten zwar in vielen realen Szenarien denen von Menschen unterlegen sind, es jedoch in verschiedenen professionellen und akademischen Benchmarks eine mit Menschen vergleichbare Leistung gezeigt hat. Dies bedeutet auch, dass GPT-4 in der Kommerzialisierung tatsächlich einen Schritt weitergekommen ist.
Bisher galt die Leistung von GPT-3 im professionellen Bereich als unbefriedigend. Beim Uniform Bar Exam (MBE+MEE+MPT) in den USA konnte GPT-3.5 nur in den unteren 10 % rangieren, während GPT - Eine Punktzahl von 4 würde bereits zu den besten 10 % zählen. Die Fähigkeiten von GPT-4 wurden in einigen Berufsfeldern erheblich verbessert und haben sich allmählich den Menschen angenähert oder sie sogar übertroffen. Dies bietet GPT-4 mehr Möglichkeiten in vielen ToB-Geschäftsfeldern.
Zum Beispiel können die von GPT-4 gebotenen Fähigkeiten in Bereichen wie Hilfsmitteln für berufliche Fertigkeiten, Anwendungen zur Wissensabfrage, beruflicher Aus- und Weiterbildung usw. revolutionär sein.
Nach der Veröffentlichung von GPT-4 erklärte Microsoft umgehend: „Wenn Sie in den letzten fünf Wochen zu irgendeinem Zeitpunkt die neue Bing-Vorschauversion verwendet haben, haben Sie die leistungsstarken Funktionen des neuesten Modells von OpenAI bereits im Voraus verstanden.“ Dies bedeutet, dass New Bing bereits GPT-4 verwendet hat. In den letzten Wochen haben viele Menschen Bing erlebt, das durch GPT-4 erweitert wurde, und nur die Verwendung von Textfunktionen geöffnet. Obwohl Microsoft zur Beschreibung nicht das Wort „Weltpremiere“ verwendet hat, hat Microsoft immerhin 13 Milliarden US-Dollar (ca. 90 Milliarden RMB) in OpenAPI investiert, und die Gegenleistung ist angemessen.
Zusätzlich zu Microsofts neuem Bing integrieren derzeit viele Unternehmen GPT-4 in ihre Produkte, darunter die Sprachlerntool-Software Duolingo, die Software zur Unterstützung sehbehinderter Benutzer BeMyEyes und das mobile Zahlungsunternehmen Stripe, das internationale Finanzdienstleistungsunternehmen Morgan Stanley usw .
Aber wir müssen zugeben, dass GPT-4 zwar die Kommerzialisierungsszenarien, in denen große Modelle implementiert werden können, erheblich erweitert hat, Rechenleistung und F&E-Kosten jedoch von vielen immer noch als schwer zu überwindende Hindernisse bei der Implementierung großer Modelle angesehen werden. Schließlich scheinen die Ausgaben für Forschung und Entwicklung sowie die Rechenleistung für große Modelle derzeit erschreckend hoch zu sein. Die von ChatGPT offengelegten Kosten für einzelne Schulungen und den täglichen Betrieb lagen kurzfristig in Millionenhöhe Begriff.
Wie wir alle wissen, ist ChatGPT ein groß angelegtes Modell zur Verarbeitung natürlicher Sprache, das von OpenAI entwickelt wurde, aber viele Menschen wissen nicht, dass seine Entwicklungsgeschichte bis ins Jahr 2015 zurückverfolgt werden kann. Im Jahr 2015 wurde OpenAI von Musk von Tesla, Sam Altman und anderen Investoren mitgegründet, mit dem Ziel, die Entwicklung des Bereichs der künstlichen Intelligenz durch fortschrittliche Technologie der künstlichen Intelligenz voranzutreiben. Musk verließ das Unternehmen 2018 aufgrund von Differenzen in der Entwicklungsrichtung des Unternehmens.
Zuvor war OpenAI für die Einführung der GPT-Reihe von Modellen zur Verarbeitung natürlicher Sprache bekannt. Seit 2018 veröffentlicht OpenAI das generative vortrainierte Sprachmodell GPT (Generative Pre-trained Transformer), mit dem verschiedene Inhalte wie Artikel, Codes, maschinelle Übersetzung und Fragen und Antworten generiert werden können.
Die Anzahl der Parameter jeder Generation von GPT-2 ist explodiert. Die Anzahl der im Februar 2019 veröffentlichten Parameter betrug 1,5 Milliarden. Als OpenAI im Mai 2020 GPT-3 veröffentlichte, war es bereits das fortschrittlichste Modell die Welt. Modell zur Erzeugung natürlicher Sprache. GPT-3 verfügt über 175 Milliarden Parameter.
Als GPT-3 als unbeaufsichtigtes Modell (heute oft als selbstüberwachtes Modell bezeichnet) auf den Markt kam, konnte es die meisten Aufgaben der Verarbeitung natürlicher Sprache, wie problemorientierte Suche, Leseverständnis, semantische Inferenz und maschinelle Übersetzung, nahezu erfüllen , Artikelgenerierung und automatische Frage und Antwort usw.
Darüber hinaus schneidet das Modell bei vielen Aufgaben gut ab, beispielsweise beim Erreichen des aktuellen Stands der Technik bei maschinellen Übersetzungsaufgaben Französisch-Englisch und Deutsch-Englisch. Die automatisch generierten Artikel sind von Menschen und Maschinen kaum zu unterscheiden ist noch überraschender. Darüber hinaus kann es bei zweistelligen Additions- und Subtraktionsaufgaben eine Genauigkeit von fast 100 % erreichen und sogar automatisch Code basierend auf der Aufgabenbeschreibung generieren. Ein unbeaufsichtigtes Modell hat mehrere Funktionen und gute Effekte, was den Menschen Hoffnung auf allgemeine künstliche Intelligenz zu geben scheint. Dies könnte der Hauptgrund dafür sein, dass GPT-3 einen so großen Einfluss hat.
Im Jahr 2021 kündigte OpenAI die Einführung eines neuen Namens namens „DALL-E“ an, einer Technologie für künstliche Intelligenz, die Bilder erzeugen kann. Gleichzeitig entwickelt OpenAI auch fortschrittlichere Technologien zur Verarbeitung natürlicher Sprache.
Ich glaube, jeder kennt die Geschichte danach. Ende 2022 eroberte ChatGPT auf Basis von GPT-3.5 die Welt mit Lichtgeschwindigkeit und wurde zum bislang größten „technischen Zusammenbruch“ der Welt stand in vielen Ländern auf der Hot-Suchliste.
Was ist mit der Zukunft von GPT? Es ist absehbar, dass sich ChatGPT mit der kontinuierlichen Weiterentwicklung der Algorithmustechnologie und der Rechenleistungstechnologie weiter zu einer fortschrittlicheren Version mit stärkeren Funktionen entwickeln, in immer mehr Bereichen eingesetzt werden und mehr und bessere Gespräche für Menschen und Inhalte generieren wird.
Vielleicht ist GPT noch weit von der aktuellen „KI“ entfernt, aber wir könnten es genauso gut als Ausgangspunkt betrachten, als Ausgangspunkt einer neuen „KI“-Ära.
Das obige ist der detaillierte Inhalt vonGPT-4 hat schon lange darauf gewartet, die „KI'-Welt erneut zu verändern.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!