Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

PHPz
PHPznach vorne
2023-10-17 14:29:05824Durchsuche

Kürzlich hat Wall-Facing Intelligence, ein führendes inländisches großes Modellunternehmen für künstliche Intelligenz, einen weiteren großen Schritt unternommen. Es hat sich mit dem Tsinghua University NLP Laboratory zusammengetan, um gemeinsam das große Modell „Superheld“ zu entwickeln und auf den Markt zu bringen. XAgent.

Durch den Aufgabentest haben die Verarbeitungsfähigkeiten von XAgent bei wirklich komplexen Aufgaben die von AutoGPT vollständig übertroffen. ??

XAgent Wer ist eine „Person“?

Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen


  • XAgent ist ein neuer KI-Agent, der komplexe Aufgaben autonom lösen kann, mit LLM als Kern menschliche Anweisungen verstehen, komplexe Pläne formulieren und autonom Maßnahmen ergreifen kann.
  • Traditionelle Agenten sind in der Regel durch vom Menschen angepasste Regeln eingeschränkt und können Probleme nur in einem begrenzten Bereich lösen. Sie sind eher „Werkzeuge“ für den menschlichen Gebrauch als echte „autonome Agenten“ und es ist schwierig, komplexe Probleme autonom zu lösen.
  • Im Gegensatz dazu ist XAgent mit der Fähigkeit zur autonomen Planung und Entscheidungsfindung
  • ausgestattet, wodurch es unabhängig agieren und neue Strategien und Lösungen entdecken kann, ohne an menschliche Vorgaben gebunden zu sein.
  • Seine Fähigkeiten haben AutoGPT völlig übertroffen und zeigen bei vielen Szenenaufgaben erstaunliche Autonomie und komplexe Aufgabenlösungsfähigkeiten, wodurch das Intelligenzniveau von KI-Agenten auf ein neues Niveau gehoben wird.

Dann kommt wieder die Frage: Wie wird es umgesetzt?

Zusammenarbeit von „linker und rechter Gehirnhälfte“, Doppelzyklusmechanismus

Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammenSo wie Menschen eine „linke und rechte Gehirnhälfte“ haben, betrachten sie bei der Bewältigung komplexer Aufgaben diese normalerweise aus zwei Perspektiven: „Makro“ und „Mikro“. Es ist notwendig, die Gesamtsituation zu koordinieren und zu planen und auch auf der Ausführungsebene zu berücksichtigen.

Im Vergleich zu AutoGPT haben Wallface Intelligence und die Tsinghua University innovativ einen „

Dual-Loop-Mechanismus

“ im Design von Die Planung zerlegt komplexe Aufgaben in einfache und umsetzbare Aufgaben.

Innere Schleife

: Verantwortlich für die lokale Aufgabenausführung und Konzentration auf Details.

Durch die Zusammenarbeit des Doppelschleifenmechanismus ist XAgent wie ein „Superheld“ im Bereich großer Modelle. Es zeigt höchste Professionalität und umfassende Fähigkeiten bei der Bewältigung verschiedener Aspekte komplexer Aufgaben.

Genau wie „Captain America“ im Marvel-Universum verfügt XAgent sowohl über eine umfassende Führung als auch über eine sorgfältige Ausführung.

In der äußeren Schleife zeigt XAgent Führung als „PlanAgent

“. Er wird komplexe Aufgaben in mehrere einfache Aufgaben aufteilen und den gesamten Prozess der Problemlösung überwachen.

Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

Zunächst zerlegt es eine gegebene komplexe Aufgabe in kleinere, besser überschaubare „Unteraufgaben“, erstellt einen „Anfangsplan“ und bildet eine Aufgabensequenz.

    Anschließend wird jede Unteraufgabe zur Lösung einzeln an die innere Schleife weitergeleitet. Während dieses Prozesses überwacht die äußere Schleife kontinuierlich den Fortschritt und Status der Aufgabe und führt auf der Grundlage des Feedbacks eine „
  • iterative Optimierung“ für nachfolgende Pläne durch. In der inneren Schleife ändert XAgent schnell seine Identität und zeigt seine Professionalität als effizienter „Ausführender“ (ToolAgent
  • ) und stellt sicher, dass die von der äußeren Schleife gelieferten Teilaufgaben den Erwartungen entsprechen.
  • Je nach Art der Teilaufgabe kann es Werkzeuge aus externen Systemen abrufen und die Teilaufgabe Schritt für Schritt lösen.

    Nachdem die Unteraufgabe abgeschlossen ist, wird eine Reflexion des aktuellen Ausführungsprozesses der Unteraufgabe generiert und an die äußere Schleife zurückgegeben, um anzuzeigen, ob die aktuelle Aufgabe abgeschlossen ist und mögliche Optimierungspunkte bei der Aufgabenausführung angezeigt werden.

    Wie in der Abbildung gezeigt, hat der Benutzer die Datei iris.zip an XAgent übermittelt, damit XAgent die Daten analysieren kann.

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Wie Sie sehen können, zerlegt XAgent diese Aufgabe zunächst durch die äußere Schleife in 4 Unteraufgaben:

    1. Überprüfen und verstehen Sie die Daten;
    2. Überprüfen Sie die Python-Umgebung des Systems und zeigen Sie sie an Ob die Datenanalysebibliothek vorhanden ist;
    3. Datenanalysecode schreiben, um die Daten zu verarbeiten und zu analysieren;
    4. Einen Analysebericht basierend auf den Ergebnissen der Python-Codeausführung schreiben.

    Anschließend verwendet XAgent bei der Ausführung jeder Unteraufgabe geschickt das Lesen und Schreiben von Dateien, Shell-Befehle, Python-Notebooks und entsprechende Pandas, Sci-Kit Learn, Seaborn, Matplotlib und andere Datenanalysebibliotheken über die innere Schleife und Führen Sie sogar eine visuelle Analyse der Daten durch.

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Bei der Ausführung derselben Aufgabe plante AutoGPT nicht, die Python-Umgebung und zugehörige Bibliotheken zu überprüfen, sondern begann direkt mit dem Schreiben von Code zur Ausführung, was zu Fehlern und Fehlermeldungen führte Es wurde auch keine umfassende Analyse der Daten durchgeführt.

    Mensch-Computer-Zusammenarbeit: ein neues Paradigma der Agenteninteraktion

    Obwohl AutoGPT die Einschränkungen des traditionellen GPT-Modells bis zu einem gewissen Grad durchbrochen hat, weist es immer noch das Phänomen von Ausführungsfehlern wie Endlosschleifen und Fehlern auf Anrufe, die einen manuellen Eingriff erfordern, können gelöst werden.

    🏜

    Für einen intelligenten Agenten ist „ob er mit Menschen kooperieren kann“ auch ein wichtiger Indikator, der seine Intelligenz widerspiegelt.

    Zuallererst verfügt XAgent über eine intuitive Benutzeroberfläche, die es Benutzern ermöglicht, die gemachten Vorschläge direkt zu überschreiben oder zu ändern und so KI-Effizienz effektiv mit menschlicher Intuition und Fachwissen kombiniert.

    Zweitens hat XAgent die Möglichkeit, „Menschen um Hilfe zu bitten“, wenn er mit unbekannten Herausforderungen konfrontiert wird. Er holt in Echtzeit Rückmeldungen, Vorschläge oder Anleitungen von Benutzern ein, um sicherzustellen, dass der Agent auch in unsicheren Bereichen leistungsfähig ist Es ist das Beste. Beste Wirkung.

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammenBilder

    Dieses Interaktionsparadigma integriert auf organische Weise die Autonomie der KI mit der menschlichen Weisheit und demonstriert eine neue kollaborative Beziehung zwischen Menschen und XAgent.

    Wie im Bild gezeigt, möchte der Benutzer, dass XAgent ihm hilft, einige köstliche Restaurants zum Feiern mit Freunden zu empfehlen, es werden jedoch keine spezifischen und detaillierten Informationen bereitgestellt.

    Zu diesem Zeitpunkt kann XAgent erkennen, dass die derzeit vom Benutzer bereitgestellten Informationen nicht ausreichen, um Empfehlungen abzugeben. Daher stellt es eine Anfrage an Menschen und fragt nach dem bevorzugten Standort, dem Budgetbereich, den Geschmackspräferenzen, Tabus usw. des Benutzers. , und nach Erhalt werden dem Benutzer empfohlene Restaurants basierend auf dem Feedback bereitgestellt.

    Aber AutoGPT begann direkt mit der Suche nach Restaurantinformationen im Internet, um Empfehlungen zu erhalten. Die endgültigen empfohlenen Ergebnisse befanden sich am falschen Ort, berücksichtigten nicht das Budget des Benutzers und entsprachen nicht den Bedürfnissen des Benutzers.

    Effiziente Kommunikationssprache, Super-Tool-Aufruf

    Unabhängig vom „Dual-Cycle“-Betriebsmechanismus oder der interaktiven Fähigkeit der „Mensch-Maschine-Zusammenarbeit“ haben sich Wallface Intelligence und das Team der Tsinghua-Universität im Gesamtdesign von XAgent konzentriert auf Intelligenz-Kernmerkmalen wie Stabilität, Effizienz und Sicherheit.

    Und strukturierte Kommunikationsmethode ist auch einer der wichtigen Faktoren beim Aufbau eines starken und stabilen intelligenten Agenten.

    XAgent verwendet Function Call als interne Kommunikationssprache, was die Vorteile der Strukturierung, Standardisierung und Vereinheitlichung bietet.

    • Strukturiert: Funktionsaufruf hat ein klares und strenges Format, das klar angibt, was erforderlich ist, und so potenzielle Fehler minimiert.
    • Standardisierung: Function Call kann den Interaktionsprozess mit externen Tools standardisieren, eine gemeinsame Sprache bereitstellen und Agenten die Möglichkeit geben, mehrere Tools zur Lösung komplexer Aufgaben zu verwenden und zu integrieren.
    • Vereinheitlichung: Durch Konvertieren aller Links wie Informationszusammenfassung, Aufgabenplanung, Werkzeugausführung usw. in spezifische Funktionsaufrufformen wird sichergestellt, dass jeder Link auf einheitliche Weise verarbeitet wird, wodurch das Systemdesign vereinfacht wird.

    Darüber hinaus ist der Tool-Aufruf auch eine der wichtigen Fähigkeiten, um zu bewerten, ob der KI-Agent in der Lage ist, komplexe Probleme zu lösen.

    XAgent verfügt in seinem Design über eine originelle Tool-Ausführungs-Engine ToolServer, die sicherere, effizientere und skalierbarere Tool-Ausführungsfunktionen erreichen kann.

    Es läuft in einer isolierten Docker-Umgebung und stellt so sicher, dass die Ausführung des Tools die Stabilität oder Sicherheit des Hauptsystems nicht beeinträchtigt.

    Dieses Design bringt mehrere Vorteile mit sich:

    • Sicherheit: Das Ausführen von Tools in einem Docker-Container schützt das Hauptsystem vor potenziellen Schäden.
    • Effizient: Das System kann Knoten basierend auf Bedarf und Nutzungsmustern starten, stoppen und neu starten, um eine optimale Ressourcennutzung zu erreichen.
    • Erweiterbar: Bequeme Codeverwaltung, Debugging und Skalierbarkeit.

    Zu den Schlüsselkomponenten von ToolServer gehören: ToolServerNode, ToolServerMonitor und ToolServerManager, die leistungsstarke Funktionen für Ausführungsvorgänge, Knoteninspektion, Zyklusverwaltung usw. bieten.

    Derzeit unterstützt ToolSever von XAgent FileSystemEnv, PythonNotoBook, WebEnv, ExecuteShell, RapidAPIEnv, AskHumanforHelp und andere Tools.

    XAgent kann uns nicht nur bei einigen einfachen Aufgaben helfen, sondern sogar beim Trainieren von Modellen.

    Benutzer möchten beispielsweise Filmkritiken analysieren und die Qualität der öffentlichen Bewertung des Films ermitteln. Zu diesem Zeitpunkt lädt XAgent zunächst den imdb-Datensatz herunter, um ein BERT-Modell zu trainieren, und verwendet das trainierte BERT-Modell, um Filmkritiken vorherzusagen.

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen

    Das Potenzial großer Modelle freisetzen und AutoGPT vollständig übertreffen

    Nach dem Testen in einer Reihe von Aufgaben kann es gesehen werden (wie in den Abbildungen a und b gezeigt). unten), basierend auf der XAgent-Leistung von GPT-4, übertrifft die Leistung des ursprünglichen GPT-4 in allen Benchmark-Tests und übertrifft AutoGPT in allen Aspekten.

    ... Programmierfähigkeit (InterCode), verkörperte Argumentationsfähigkeit (ALFWorld), reale komplexe Aufgaben usw.

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammenAbbildung a: XAgent übertrifft AutoGPT bei der Verarbeitung wirklich komplexer Aufgaben vollständig Das Systemdesign kann die Grundfunktionen von GPT-4 voll ausschöpfen und extrem hohe Testergebnisse und menschliche Präferenzen (Human Preference) erzielen.

    Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammenDies zeigt nicht nur, dass XAgent bei herkömmlichen KI-Tests, die eine Inferenzplanung erfordern, eine gute Leistung erbringt, sondern auch eine höhere Leistung bei der Verarbeitung komplexer tatsächlicher Anweisungen aufweist.

    Erweitert Anwendungsgrenzen und solide technische Grundlage Die Entwicklung von Big Model hat es der gesamten Branche ermöglicht, die wichtige Implementierungsrichtung der Big Model-Technologie zu erkennen, die die Aufgabenausführung eines vollständigen Satzes von Arbeitsabläufen realisieren kann, ohne dass eine komplexe sofortige Erkundung erforderlich ist.

    Als großer Model-„Superheld“ mit unbegrenztem Potenzial kann XAgent zum „persönlichen Assistenten“ für jeden gewöhnlichen Menschen werden. Es kann uns helfen, unseren Zeitplan zu planen, Reiserouten zu organisieren und die Zeit- und Ressourcenverteilung im Leben und bei der Arbeit zu verwalten.

    Es kann auch unabhängig eine Vielzahl von Tools zur Datenerfassung, -verarbeitung und -analyse verwenden, um umfangreiche Daten vollautomatisch zu analysieren und Berichte zu erstellen, sodass Benutzer wichtige Informationen effizient erhalten können.

    Darüber hinaus kann XAgent externe Tools mit autonomen Planungsalgorithmen kombinieren, um Entscheidungen auf der Grundlage von Umgebungsinformationen zu treffen und so eine effizientere und genauere Aufgabenausführung zu erreichen.

    Das Forschungs- und Entwicklungsteam von XAgent besteht aus einer Reihe von Experten und Wissenschaftlern auf dem Gebiet großer Modelle von Wall-Facing Intelligence und dem THUNLP-Labor der Tsinghua-Universität. Sie ähneln eher den „Superhelden“ großer Models.

    Der Grund, warum diese innovative Errungenschaft erfolgreich eingeführt werden kann, liegt darin, dass das Team im Laufe des langfristigen wissenschaftlichen Forschungsprozesses eine Reihe hochmoderner innovativer Großmodelle von Infra aufgebaut hat, wodurch die technische Grundlage gefestigt und die Grenzen der Innovation erweitert wurden Forschung und Entwicklung.

    Wallface Intelligence hat sich mit dem NLP-Labor der Tsinghua University und der Open-Source-Community OpenBMB zusammengetan, um ein „Trinity“-Großmodell-Ökosystem für Industrie, Universität und Forschung zu erstellen, und hat mehrere Frameworks und Engines für die Verwendung großer Modelltools vorgeschlagen und veröffentlicht:

    Werkzeuglernen: Das Paradigma des Werkzeuglernens mit großen Modellen integriert die Vorteile professioneller Werkzeuge mit großen Modellen, um eine höhere Genauigkeit, Effizienz und Autonomie bei der Problemlösung zu erreichen.

    BMTools: Large Model Learning Engine ist ein Open-Source-Warehouse, das es Sprachmodellen ermöglicht, Erweiterungstools zu verwenden. Es ist auch eine Open-Source-Community-Building- und Sharing-Tool-Plattform.

    ToolLLM, ein Lernframework für große Modelltools, verbindet große Modelle mit mehr als 16.000 echten APIs und ermöglicht es großen Modellen, komplexere Benutzerbefehlsaufgaben durch den Aufruf externer Tools auszuführen.

    WebCPM, das erste Modell-Framework im chinesischen Bereich, das die Online-Suche unterstützt, füllt die Lücke im Bereich inländischer großer Modelle und ermöglicht es großen Modellen, wie Menschen in Echtzeit nach Antworten auf Webseiten zu suchen, wodurch die Echtzeit verbessert wird. Zeitleistung und Genauigkeit von AIGC.
    • XAgent erweitert die Obergrenze der Fähigkeit von KI-Agenten, komplexe Aufgaben auszuführen, und ermöglicht es uns, den neuesten Trend und das unbegrenzte Potenzial der Integration großer Modelltechnologie in Produktion und Leben zu erkennen.

Das obige ist der detaillierte Inhalt vonWall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen