Heim > Artikel > Technologie-Peripheriegeräte > Wall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen
Kürzlich hat Wall-Facing Intelligence, ein führendes inländisches großes Modellunternehmen für künstliche Intelligenz, einen weiteren großen Schritt unternommen. Es hat sich mit dem Tsinghua University NLP Laboratory zusammengetan, um gemeinsam das große Modell „Superheld“ zu entwickeln und auf den Markt zu bringen. XAgent.
Durch den Aufgabentest haben die Verarbeitungsfähigkeiten von XAgent bei wirklich komplexen Aufgaben die von AutoGPT vollständig übertroffen. ??
XAgent Wer ist eine „Person“?
Zusammenarbeit von „linker und rechter Gehirnhälfte“, Doppelzyklusmechanismus So wie Menschen eine „linke und rechte Gehirnhälfte“ haben, betrachten sie bei der Bewältigung komplexer Aufgaben diese normalerweise aus zwei Perspektiven: „Makro“ und „Mikro“. Es ist notwendig, die Gesamtsituation zu koordinieren und zu planen und auch auf der Ausführungsebene zu berücksichtigen.
Im Vergleich zu AutoGPT haben Wallface Intelligence und die Tsinghua University innovativ einen „
Dual-Loop-Mechanismus“ im Design von Die Planung zerlegt komplexe Aufgaben in einfache und umsetzbare Aufgaben.
Innere Schleife
: Verantwortlich für die lokale Aufgabenausführung und Konzentration auf Details.
Durch die Zusammenarbeit des Doppelschleifenmechanismus ist XAgent wie ein „Superheld“ im Bereich großer Modelle. Es zeigt höchste Professionalität und umfassende Fähigkeiten bei der Bewältigung verschiedener Aspekte komplexer Aufgaben.
In der äußeren Schleife zeigt XAgent Führung als „PlanAgent
“. Er wird komplexe Aufgaben in mehrere einfache Aufgaben aufteilen und den gesamten Prozess der Problemlösung überwachen.Zunächst zerlegt es eine gegebene komplexe Aufgabe in kleinere, besser überschaubare „Unteraufgaben“, erstellt einen „Anfangsplan“ und bildet eine Aufgabensequenz.
Je nach Art der Teilaufgabe kann es Werkzeuge aus externen Systemen abrufen und die Teilaufgabe Schritt für Schritt lösen.
Nachdem die Unteraufgabe abgeschlossen ist, wird eine Reflexion des aktuellen Ausführungsprozesses der Unteraufgabe generiert und an die äußere Schleife zurückgegeben, um anzuzeigen, ob die aktuelle Aufgabe abgeschlossen ist und mögliche Optimierungspunkte bei der Aufgabenausführung angezeigt werden.
Wie in der Abbildung gezeigt, hat der Benutzer die Datei iris.zip an XAgent übermittelt, damit XAgent die Daten analysieren kann.
Wie Sie sehen können, zerlegt XAgent diese Aufgabe zunächst durch die äußere Schleife in 4 Unteraufgaben:
Anschließend verwendet XAgent bei der Ausführung jeder Unteraufgabe geschickt das Lesen und Schreiben von Dateien, Shell-Befehle, Python-Notebooks und entsprechende Pandas, Sci-Kit Learn, Seaborn, Matplotlib und andere Datenanalysebibliotheken über die innere Schleife und Führen Sie sogar eine visuelle Analyse der Daten durch.
Bei der Ausführung derselben Aufgabe plante AutoGPT nicht, die Python-Umgebung und zugehörige Bibliotheken zu überprüfen, sondern begann direkt mit dem Schreiben von Code zur Ausführung, was zu Fehlern und Fehlermeldungen führte Es wurde auch keine umfassende Analyse der Daten durchgeführt.
Obwohl AutoGPT die Einschränkungen des traditionellen GPT-Modells bis zu einem gewissen Grad durchbrochen hat, weist es immer noch das Phänomen von Ausführungsfehlern wie Endlosschleifen und Fehlern auf Anrufe, die einen manuellen Eingriff erfordern, können gelöst werden.
🏜
Für einen intelligenten Agenten ist „ob er mit Menschen kooperieren kann“ auch ein wichtiger Indikator, der seine Intelligenz widerspiegelt.
Zuallererst verfügt XAgent über eine intuitive Benutzeroberfläche, die es Benutzern ermöglicht, die gemachten Vorschläge direkt zu überschreiben oder zu ändern und so KI-Effizienz effektiv mit menschlicher Intuition und Fachwissen kombiniert.
Zweitens hat XAgent die Möglichkeit, „Menschen um Hilfe zu bitten“, wenn er mit unbekannten Herausforderungen konfrontiert wird. Er holt in Echtzeit Rückmeldungen, Vorschläge oder Anleitungen von Benutzern ein, um sicherzustellen, dass der Agent auch in unsicheren Bereichen leistungsfähig ist Es ist das Beste. Beste Wirkung.
Bilder
Dieses Interaktionsparadigma integriert auf organische Weise die Autonomie der KI mit der menschlichen Weisheit und demonstriert eine neue kollaborative Beziehung zwischen Menschen und XAgent.
Wie im Bild gezeigt, möchte der Benutzer, dass XAgent ihm hilft, einige köstliche Restaurants zum Feiern mit Freunden zu empfehlen, es werden jedoch keine spezifischen und detaillierten Informationen bereitgestellt.
Zu diesem Zeitpunkt kann XAgent erkennen, dass die derzeit vom Benutzer bereitgestellten Informationen nicht ausreichen, um Empfehlungen abzugeben. Daher stellt es eine Anfrage an Menschen und fragt nach dem bevorzugten Standort, dem Budgetbereich, den Geschmackspräferenzen, Tabus usw. des Benutzers. , und nach Erhalt werden dem Benutzer empfohlene Restaurants basierend auf dem Feedback bereitgestellt.
Aber AutoGPT begann direkt mit der Suche nach Restaurantinformationen im Internet, um Empfehlungen zu erhalten. Die endgültigen empfohlenen Ergebnisse befanden sich am falschen Ort, berücksichtigten nicht das Budget des Benutzers und entsprachen nicht den Bedürfnissen des Benutzers.
Unabhängig vom „Dual-Cycle“-Betriebsmechanismus oder der interaktiven Fähigkeit der „Mensch-Maschine-Zusammenarbeit“ haben sich Wallface Intelligence und das Team der Tsinghua-Universität im Gesamtdesign von XAgent konzentriert auf Intelligenz-Kernmerkmalen wie Stabilität, Effizienz und Sicherheit.
Und strukturierte Kommunikationsmethode ist auch einer der wichtigen Faktoren beim Aufbau eines starken und stabilen intelligenten Agenten.
XAgent verwendet Function Call als interne Kommunikationssprache, was die Vorteile der Strukturierung, Standardisierung und Vereinheitlichung bietet.
Darüber hinaus ist der Tool-Aufruf auch eine der wichtigen Fähigkeiten, um zu bewerten, ob der KI-Agent in der Lage ist, komplexe Probleme zu lösen.
XAgent verfügt in seinem Design über eine originelle Tool-Ausführungs-Engine ToolServer, die sicherere, effizientere und skalierbarere Tool-Ausführungsfunktionen erreichen kann.
Es läuft in einer isolierten Docker-Umgebung und stellt so sicher, dass die Ausführung des Tools die Stabilität oder Sicherheit des Hauptsystems nicht beeinträchtigt.
Dieses Design bringt mehrere Vorteile mit sich:
Zu den Schlüsselkomponenten von ToolServer gehören: ToolServerNode, ToolServerMonitor und ToolServerManager, die leistungsstarke Funktionen für Ausführungsvorgänge, Knoteninspektion, Zyklusverwaltung usw. bieten.
Derzeit unterstützt ToolSever von XAgent FileSystemEnv, PythonNotoBook, WebEnv, ExecuteShell, RapidAPIEnv, AskHumanforHelp und andere Tools.
XAgent kann uns nicht nur bei einigen einfachen Aufgaben helfen, sondern sogar beim Trainieren von Modellen.
Benutzer möchten beispielsweise Filmkritiken analysieren und die Qualität der öffentlichen Bewertung des Films ermitteln. Zu diesem Zeitpunkt lädt XAgent zunächst den imdb-Datensatz herunter, um ein BERT-Modell zu trainieren, und verwendet das trainierte BERT-Modell, um Filmkritiken vorherzusagen.
Nach dem Testen in einer Reihe von Aufgaben kann es gesehen werden (wie in den Abbildungen a und b gezeigt). unten), basierend auf der XAgent-Leistung von GPT-4, übertrifft die Leistung des ursprünglichen GPT-4 in allen Benchmark-Tests und übertrifft AutoGPT in allen Aspekten.
... Programmierfähigkeit (InterCode), verkörperte Argumentationsfähigkeit (ALFWorld), reale komplexe Aufgaben usw.Abbildung a: XAgent übertrifft AutoGPT bei der Verarbeitung wirklich komplexer Aufgaben vollständig Das Systemdesign kann die Grundfunktionen von GPT-4 voll ausschöpfen und extrem hohe Testergebnisse und menschliche Präferenzen (Human Preference) erzielen. Dies zeigt nicht nur, dass XAgent bei herkömmlichen KI-Tests, die eine Inferenzplanung erfordern, eine gute Leistung erbringt, sondern auch eine höhere Leistung bei der Verarbeitung komplexer tatsächlicher Anweisungen aufweist. Erweitert Anwendungsgrenzen und solide technische Grundlage Die Entwicklung von Big Model hat es der gesamten Branche ermöglicht, die wichtige Implementierungsrichtung der Big Model-Technologie zu erkennen, die die Aufgabenausführung eines vollständigen Satzes von Arbeitsabläufen realisieren kann, ohne dass eine komplexe sofortige Erkundung erforderlich ist. Als großer Model-„Superheld“ mit unbegrenztem Potenzial kann XAgent zum „persönlichen Assistenten“ für jeden gewöhnlichen Menschen werden. Es kann uns helfen, unseren Zeitplan zu planen, Reiserouten zu organisieren und die Zeit- und Ressourcenverteilung im Leben und bei der Arbeit zu verwalten. Es kann auch unabhängig eine Vielzahl von Tools zur Datenerfassung, -verarbeitung und -analyse verwenden, um umfangreiche Daten vollautomatisch zu analysieren und Berichte zu erstellen, sodass Benutzer wichtige Informationen effizient erhalten können. Das Forschungs- und Entwicklungsteam von XAgent besteht aus einer Reihe von Experten und Wissenschaftlern auf dem Gebiet großer Modelle von Wall-Facing Intelligence und dem THUNLP-Labor der Tsinghua-Universität. Sie ähneln eher den „Superhelden“ großer Models. Der Grund, warum diese innovative Errungenschaft erfolgreich eingeführt werden kann, liegt darin, dass das Team im Laufe des langfristigen wissenschaftlichen Forschungsprozesses eine Reihe hochmoderner innovativer Großmodelle von Infra aufgebaut hat, wodurch die technische Grundlage gefestigt und die Grenzen der Innovation erweitert wurden Forschung und Entwicklung. Wallface Intelligence hat sich mit dem NLP-Labor der Tsinghua University und der Open-Source-Community OpenBMB zusammengetan, um ein „Trinity“-Großmodell-Ökosystem für Industrie, Universität und Forschung zu erstellen, und hat mehrere Frameworks und Engines für die Verwendung großer Modelltools vorgeschlagen und veröffentlicht: BMTools: Large Model Learning Engine ist ein Open-Source-Warehouse, das es Sprachmodellen ermöglicht, Erweiterungstools zu verwenden. Es ist auch eine Open-Source-Community-Building- und Sharing-Tool-Plattform. ToolLLM, ein Lernframework für große Modelltools, verbindet große Modelle mit mehr als 16.000 echten APIs und ermöglicht es großen Modellen, komplexere Benutzerbefehlsaufgaben durch den Aufruf externer Tools auszuführen. WebCPM, das erste Modell-Framework im chinesischen Bereich, das die Online-Suche unterstützt, füllt die Lücke im Bereich inländischer großer Modelle und ermöglicht es großen Modellen, wie Menschen in Echtzeit nach Antworten auf Webseiten zu suchen, wodurch die Echtzeit verbessert wird. Zeitleistung und Genauigkeit von AIGC.
Darüber hinaus kann XAgent externe Tools mit autonomen Planungsalgorithmen kombinieren, um Entscheidungen auf der Grundlage von Umgebungsinformationen zu treffen und so eine effizientere und genauere Aufgabenausführung zu erreichen.
Das obige ist der detaillierte Inhalt vonWall-Facing Intelligence übertrifft AutoGPT umfassend und arbeitet mit der Open-Source-Großversion „Superhero“ XAgent des Tsinghua NLP Laboratory zusammen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!