Maison > Article > Périphériques technologiques > NVIDIA lance le système d'IA Eureka, qui permet aux robots d'effectuer des tâches complexes telles que tourner un stylo et passer des passes
Selon les informations du 23 octobre, Nvidia a récemment annoncé un système d'IA appelé Eureka, basé sur le GPT-4 d'OpenAI et permettant aux robots d'effectuer des tâches telles que « tourner des stylos », « ouvrir des tiroirs », « tenir des ciseaux ». plus de 30 actions complexes comme « passer le ballon entre les mains ».
Après enquête, ce site a appris que l'Institut de recherche NVIDIA avait dirigé le développement d'Eureka. Ce système d'IA permet aux développeurs d'effectuer un apprentissage par renforcement (apprentissage de référence) avec le logiciel de simulation physique de NVIDIA, Isaac Gym.
Anima Anandkumar, directrice principale du département de recherche en IA de NVIDIA, estime que même si « l'apprentissage par renforcement » a fait des progrès au cours des 10 dernières années, il reste encore de nombreux défis, tels que la « conception des récompenses » et d'autres aspects, qui sont encore en suspens. étape « essais et erreurs ». L'Eureka actuellement annoncé par NVIDIA est conçu pour effectuer des tâches difficiles et constitue la première tentative de combiner IA générative et algorithmes d'apprentissage par renforcement.
Le système de « conception de récompense » généré par Eureka à l'aide de GPT-4 peut faciliter l'apprentissage « par essais et erreurs » du robot et peut prendre en charge les tâches de 80 % des experts humains, augmentant ainsi l'efficacité moyenne de la formation du robot. Amélioré de plus de 50%.
Il est rapporté que lorsqu'Eureka génère un plan de « conception de récompense », les développeurs n'ont pas besoin de saisir des invites de tâches supplémentaires ou d'écrire des modèles de récompense prédéfinis. Combinées à une correction manuelle des récompenses, les actions du robot sont finalement plus conformes aux intentions du développeur. .
Lorsqu'il est utilisé avec Isaac Gym, ce système d'IA peut utiliser l'accélération GPU pour effectuer des simulations et évaluer rapidement la qualité d'un grand nombre de lots de commentaires des candidats, améliorant ainsi l'efficacité de la formation et réalisant des résumés statistiques basés sur les résultats de la formation pour améliorer la "récompense". schéma". Tout en améliorant le niveau de réponse des robots, le système d'IA est applicable à un plus large éventail de types de robots, tels que le "type animal" (à quatre pattes), le "type humain (bipède)", " quadricoptère", robots à bras, etc. Tous peuvent être équipés du système Eureka.
▲ Source de l'image NVIDIA
▲ Source de l'image NVIDIA
NVIDIA a effectué un "test d'analyse comparative de sensibilité Open Source" sur Eureka, et après avoir évalué les résultats d'entraînement de 20 tâches, il est arrivé à des résultats satisfaisants.
En conséquence, NVIDIA estime qu'Eureka peut permettre un contrôle habile du robot et fournir aux animateurs de nouvelles façons de "générer des mouvements physiques réalistes".
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!