Maison > Article > Périphériques technologiques > HaoMo Zhixing : Le grand modèle cognitif de conduite autonome a été officiellement mis à niveau vers DriveGPT
Le 17 février, Haomo Zhixing a annoncé que son grand modèle cognitif de conduite autonome avait été officiellement mis à niveau vers DriveGPT et annoncerait ses dernières avancées importantes lors du HAOMOAI DAY en avril 2023.
Alors que ChatGPT devient populaire sur Internet, le grand modèle Transformer et la technologie « Human Feedback Reinforcement Learning (RLHF) » qu'il utilise ont une fois de plus attiré l'attention de l'industrie. Dans le domaine de la conduite autonome, Feimo a été le premier en Chine à introduire le grand modèle Transformer dans le système d'intelligence de données MANA. Lors du HAOMO AI DAY en janvier 2023, Gu Weihao, PDG de Haomo Zhixing, a présenté que le grand modèle cognitif auto-supervisé pour la conduite humaine lancé par Haomo s'était inspiré des idées de mise en œuvre de ChatGPT et avait adopté la technologie RLHF (Human Feedback Reinforcement Learning). . Introduction de données réelles de prise de contrôle du conducteur humain pour optimiser en permanence le modèle de prise de décision cognitive de conduite autonome.
L’algorithme de prise de décision cognitive de Haimo a traversé trois étapes d’évolution. La première étape consiste à introduire un apprentissage par imitation de bout en bout de scénarios individuels pour s'adapter directement au comportement de conduite humain. La deuxième étape consiste à utiliser de grands modèles cognitifs pour introduire des quantités massives de données de conduite humaine normale et parvenir à une prise de décision cognitive contrôlable et explicable grâce à des invites. La troisième étape, qui est l'étape actuelle, introduit des données de prise de contrôle réelles et commence à utiliser l'algorithme RLHF dans un grand modèle pour apprendre des données de prise de contrôle de la conduite humaine. À cette fin, Hao Mo a construit un modèle de classement par paires comprenant « l'ancienne stratégie, la stratégie de rachat et la stratégie d'étiquetage manuelle ». Sur la base de ce modèle de classement, Haimo a construit un modèle de récompense pour les décisions de conduite autonome afin de prendre des décisions optimales dans divers scénarios de planification. Grâce à ce grand modèle, dans les scènes difficiles reconnues telles que les demi-tours et les ronds-points, le taux de réussite des scènes est augmenté de plus de 30 %.
Le 17 février, Hao Mo Zhixing a officiellement mis à niveau le grand modèle cognitif pour la supervision de la conduite autonome vers « DriveGPT », qui est également le premier grand modèle cognitif au monde pour la conduite autonome. À l'heure actuelle, Haimo DriveGPT a terminé la construction du modèle et l'exploitation des données de première étape, et l'échelle des paramètres peut comparer le niveau de GPT-2. Ensuite, DriveGPT continuera d'introduire des données de prise de contrôle réelles à grande échelle et d'améliorer continuellement l'effet d'évaluation grâce à l'apprentissage renforcé des données de conduite humaine. DriveGPT sera également utilisé comme modèle d'évaluation cloud pour évaluer l'effet de conduite des petits modèles de voiture. Les dernières avancées importantes de Haomo DriveGPT seront annoncées lors du 8ème HAOMO AI DAY en avril 2023.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!