Heim >Tutorial für Handyspiele >Gaming-Neuigkeiten >Was ist der Allzweck-KI-Agent „SIMA' von Google DeepMind für virtuelle 3D-Umgebungen? [CEDEC 2024]
Am 21. August 2024 fand die Sitzung „SIMA: Entwicklung allgemeiner KI-Agenten mit Videospielen“ auf der Spieleentwicklerkonferenz „CEDEC 2024“ statt.
SIMA-SchulungAußerdem wurde eine Einführung in den Aufbau der SIMA-Lernpipeline gegeben. Laut Mufarek wird SIMA durch die erste Einbindung in die Spiel- und Forschungsumgebung in der Lage sein, das Spiel wie ein Mensch zu spielen, ohne Zugriff auf Quellcode oder spezielle APIs zu haben. Darüber hinaus erfolgt das Onboarding für Spiele und Forschungsumgebungen in Zusammenarbeit mit dem Spieleentwickler. Hiermit soll geklärt werden, wer für den Umgang mit den im Spiel und SIMA-Projekt verwendeten Daten verantwortlich ist. Laut Mufarek erforderte das SIMA-Projekt ein vielfältiges und gewaltfreies Lernportfolio. Aus diesem Grund haben wir eine Vielzahl von Spieltiteln ausgewählt, darunter solche, die visuell natürlich, industriell, realistisch, Science-Fiction oder aus der Ego- oder Third-Person-Perspektive sind. Es enthält auch Open-World- und Sandbox-Elemente, um SIMA die Durchführung verschiedener Aktionen durch komplexe Mechanismen zu ermöglichen. SIMA verwendet eine Allzweckschnittstelle, um einen Allzweck-KI-Agenten zu erstellen. SIMA erhält Ziele und Anweisungen von Menschen zunächst in Form von Texten in natürlicher Sprache und erkennt diese dann in Echtzeit. Dann spielen sie, genau wie Menschen, Spiele mit einem Controller oder Tastatur und Maus. Mufarek erklärte, dass SIMA durch die Verwendung einer solchen Allzweckschnittstelle ohne Anpassung in jedes Spiel integriert werden kann. Zusätzlich wurden zwei Methoden zur Erstellung von SIMA-Trainingsdaten verwendet. Eine besteht darin, dass eine einzelne Person das Spiel spielt, das Video ansieht und wichtige Punkte in natürlicher Sprache kommentiert. Bei der zweiten Methode handelt es sich um Teams aus zwei Personen, wobei eine Person Anweisungen in natürlicher Sprache gibt und die andere ihnen folgt, ein Gameplay-Video dreht und Anmerkungen hinzufügt. Der SIMA-Datensatz ist die Hinzufügung von Tastatur- und Maus-Bediendaten. Diese Datensätze umfassen Fähigkeiten, die für das SIMA-Gameplay erforderlich sind, wie zum Beispiel „Objekte erstellen“ und „ein Auto fahren“ im Spiel. Durch die Sammlung dieser Fähigkeiten für alle Titel ist die Gesamtzahl riesig, reicht aber für das SIMA-Projekt immer noch nicht aus. Herr Mufarek sagte, je höher die Qualität der Daten und Anmerkungen sei, desto nützlicher seien sie für die Verbesserung von SIMA, und er werde solche Anstrengungen auch weiterhin unternehmen. Sobald der Datensatz fertig ist, kann das SIMA-Lerntraining endlich beginnen. Die hier verwendete Technik ist das „konditionierte Verhaltensklonen“, bei dem Lernen durch Nachahmung des menschlichen Spiels erfolgt. Im Kern handelt es sich um eine Architektur, die vorab trainierte Modelle unterstützt, aber da Gemini zum Zeitpunkt seiner Entwicklung noch nicht existierte, nutzt es Classifier-Free Guidance (CFG), um verbalen Anweisungen Vorrang vor visuellen Eingaben zu geben Kinder lernen, natürliche Sprache zu verstehen und haben ihnen geholfen, natürliche Sprache gut zu verstehen. In der Phase zur Auswertung der SIMA-Ergebnisse wurde ein Herausforderungssatz erstellt, um die Leistung bei verschiedenen Aufgaben zu messen. Eine Aufgabe besteht aus drei Elementen: Das erste ist der „Anfangszustand“, in dem SIMA seine Aktionen startet, das zweite ist das „Ziel/die Anweisung“, dem SIMA folgen muss, und das dritte ist der „Anfangszustand“, der bestimmt, ob die Aufgabe ausgeführt wird oder nicht Erfolgskriterium erfüllt ist. SIMA verwendet außerdem „Ground Truth“, das programmgesteuert ermittelt, ob eine Aufgabe erfolgreich abgeschlossen wurde, „Optical Character Recognition (OCR)“, das Feedback zu durchgeführten Aktionen basierend auf Änderungen im Text auf dem Bildschirm liefert, und menschliches IT Außerdem wurde eingeführt, dass die Bewertung aus drei Perspektiven erfolgen wird: „menschliche Bewertung“, bei der das Video überprüft und bestätigt wird, ob die Aufgabe erfolgreich abgeschlossen wurde. SIMA frühe Forschungsergebnisse und Grenzen dieses AnsatzesFrühe Forschungsergebnisse des Projekts zeigten, dass SIMA Aufgaben erledigen kann, die häufig in einer Vielzahl von Spielen ausgeführt werden, beispielsweise „vorwärts gehen“ und „ein Menü öffnen“. Sie konnten auch Aufgaben erfolgreich abschließen, die von Spiel zu Spiel unterschiedliche Bedeutungen haben können, wie zum Beispiel den Start eines Raumschiffs in „No Man’s Sky“ oder das Steuern eines Bootes in „Teardown“. Ob die Spieler hingegen in der Lage waren, die spielspezifischen Aufgaben zu lösen, wurde anhand von drei separat vorbereiteten Methoden bewertet. Einer davon ist „Spezialist“, der anhand von Daten aus einem einzelnen Spiel trainiert und in derselben Umgebung bewertet wird. Dies gilt als 100-prozentige Leistung als Basis für die Bewertung. Das zweite ist „SIMA“, das Daten aus 10 Spielen trainiert und diese dann in der Umgebung eines der Spiele testet und auswertet. Der dritte ist „Zero-Shot“, der Daten von 9 von 10 Titeln trainiert und sie in der Spielumgebung des verbleibenden 1 Titels testet und auswertet. Infolgedessen zeigte SIMA beim Erlernen aller 10 Titel eine höhere Leistung als Specialist und selbst mit Zero-Shot eine Leistung, die der von Specialist nahe kam. Mit anderen Worten, Herr Mufarek war sehr zufrieden, weil er bestätigen konnte, dass „ein KI-Agent in einer Umgebung etwas lernen und diese Fähigkeit nutzen kann, um in einer anderen Umgebung etwas zu tun.“ Das Ziel dieses Projekts besteht jedoch darin, „einen KI-Agenten zu entwickeln, der durch Sprache bedingt ist“. Wenn daher Lernen und Testen ohne Anmerkungen in natürlicher Sprache durchgeführt wurden, verschlechterte sich die Leistung von SIMA erheblich. Zum ersten Mal wurde die Hypothese bewiesen, dass „das Training eines einzelnen Agenten in vielen großen Umgebungen zu einem Lerntransfer und einer Generalisierung führt“. Er sagte jedoch, dass dies seine Motivation sei, künftig SIMA-Forschung zu betreiben. Bisher haben wir daran geforscht, die Leistung von KI-Agenten durch Lernen zu verbessern, aber beispielsweise aufgrund von Updates für „StarCraft II“ hat sich die Leistung von AlphaStar verschlechtert. Mufarek sagte: „Es ist nicht realistisch, den KI-Agenten jedes Mal neu zu trainieren, wenn das Spiel aktualisiert wird“, und glaubt, dass der KI-Agent durch die allgemeinere Gestaltung von SIMA auch im neuen Zustand eine gute Leistung erbringen kann Dem Spiel wurden Funktionen hinzugefügt. Außerdem eignet sich SIMA gut für Aufgaben, die in kurzer Zeit erledigt werden können, wie zum Beispiel „Brennholz sammeln“ und „Brennholz anzünden“, aber nicht immer gut für Aufgaben, die Planung, mehrere Schritte und Überlegungen erfordern, wie z als „ein Haus bauen“. Nun scheint es jedoch, dass Gemini eine starke Unterstützung für SIMA sein kann. Beispielsweise kann Gemini eine lange Aufgabe wie „ein Haus bauen“ in kurze Aufgaben aufteilen und diese an SIMA übergeben. Herr Mufarek bekräftigte, dass das SIMA-Projekt zwar sehr spannend sei und große Vielseitigkeit verspreche, dass es sich jedoch noch nicht zu einem vollständig universell einsetzbaren KI-Agenten entwickelt habe, und fügte hinzu: „Mit etwas mehr Innovation könnte daraus etwas werden, das jede Aufgabe erfüllen kann.“ „Wenn das passiert, werden weitere Entwicklungen möglich.“ |
Das obige ist der detaillierte Inhalt vonWas ist der Allzweck-KI-Agent „SIMA' von Google DeepMind für virtuelle 3D-Umgebungen? [CEDEC 2024]. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!