Maison > Article > Tutoriel logiciel > Idéal pour rejoindre la compétition « de bout en bout » : même s’il ne s’agit que d’un PPT
La concurrence de bout en bout est une tendance très médiatisée dans le domaine technologique actuel. Li Auto fait-elle une différence dans cet aspect ? L'éditeur PHP Youzi vous donnera une discussion approfondie de la présentation de bout en bout de Li Auto, de l'affichage PPT à la mise en œuvre réelle, pour explorer ses indices.
La tendance « de bout en bout » balaie l'industrie chinoise de la conduite intelligente.
À l'aube du second semestre 2024, si un constructeur automobile ne parle pas de « bout en bout » lorsqu'il parle de conduite intelligente, il sera très probablement considéré comme en retard.
Le 5 juillet, Li Auto a publié une nouvelle architecture technologique de conduite autonome basée sur le modèle de bout en bout, le modèle de langage visuel VLM et le modèle mondial. Il s’agit essentiellement d’un résultat méthodologique du parcours de bout en bout d’Ideal Auto, qui présente plus complètement le prochain parcours de développement d’Ideal Intelligent Driving.
Du point de vue de Huxiu Automobile, il y a trois axes majeurs dignes d'attention dans cette version : En quoi l'idéal « de bout en bout » est-il différent de celui des autres acteurs ? Dans quelle mesure le développement de la conduite intelligente idéale a-t-il atteint ? Et pourquoi Ideal met-il actuellement l’accent sur les capacités techniques de la conduite intelligente ?
Par rapport à Huawei, la solution d'Ideal est plus radicale
Regardons d'abord la nouvelle architecture technologique de conduite autonome d'Ideal. Inspiré de la théorie des systèmes rapides et lents du prix Nobel Daniel Kahneman, il simule la pensée humaine et les processus de prise de décision dans le domaine de la conduite autonome, en utilisant des « systèmes rapides » et des « systèmes lents » pour la collaboration.
Le système rapide, également connu sous le nom de Système 1, est efficace pour gérer des tâches simples. Il s'agit d'une intuition humaine formée sur la base de l'expérience et des habitudes, qui est suffisante pour gérer 95 % des scénarios de routine lors de la conduite d'un véhicule.
Le système lent, également connu sous le nom de Système 2, est le raisonnement logique, l'analyse complexe et les capacités informatiques formées par les humains grâce à une compréhension et un apprentissage plus approfondis. Il est utilisé pour résoudre des scénarios de circulation complexes, voire inconnus, lors de la conduite d'un véhicule et de la comptabilité. pour 50 % de la conduite quotidienne Environ 5 %.
Dans ce prototype d'architecture, le système 1 est implémenté par le modèle de bout en bout, qui reçoit les entrées du capteur et génère directement la trajectoire de conduite pour contrôler le véhicule. Le système 2 est implémenté par le modèle de langage visuel VLM. Après avoir reçu les entrées du capteur, il transmet les informations de prise de décision au système 1 après une réflexion logique. La capacité de conduite autonome composée de deux systèmes sera formée et vérifiée à l'aide du modèle mondial dans le cloud.
Selon la théorie idéale, le modèle de bout en bout du système 1 adopte la solution One Model, qui est principalement composée de caméras et de fonctionnalités multicapteurs lidar extraites et fusionnées par le réseau fédérateur CNN et projetées. dans l’espace BEV.
De plus, Ideal ajoute également des informations sur l'état du véhicule et des informations de navigation à l'extrémité d'entrée. Après encodage par le modèle Transformer, il est décodé avec les fonctionnalités BEV pour décoder les obstacles dynamiques, les structures routières et les obstacles généraux, et planifier la trajectoire de conduite.
Par rapport aux solutions segmentées de bout en bout adoptées par des fabricants tels que Huawei et Xpeng, la solution One Model adoptée par Ideal est plus radicale. Tesla est également une solution One Model, mais sa solution « image d'entrée, contrôle de sortie » va plus loin que l'idéal « informations du capteur d'entrée, trajectoire de conduite de sortie ».
Il convient de souligner que les chemins de bout en bout actuellement utilisés par les différents fabricants ne sont que des différences de choix, et qu'il n'y a aucune distinction entre avantages et inconvénients. (Quant aux principes techniques de bout en bout, l'équipe Huxiu Automobile a fourni une analyse détaillée dans l'article "Tesla va faire la guerre à Huawei")
La particularité de cette architecture idéale est en fait le Système 2, qui est basé sur L'architecture algorithmique du modèle de langage visuel VLM consiste en un modèle de transformateur unifié, qui encode le texte d'invite (mot d'invite) avec un Tokenizer (segmenteur de mots), encode les informations visuelles de l'image de la caméra prospective et les informations de la carte de navigation. , puis utilise l'image et le texte pour coder les informations visuelles. Le module d'alignement effectue un alignement modal, et enfin effectue un raisonnement autorégressif unifié, génère la compréhension de l'environnement, des décisions de conduite et des trajectoires de conduite, et les transmet au système 1 pour l'aider. contrôler le véhicule.
Dans des scénarios réels, si le système 2 constate que la surface de la route est très cahoteuse et inégale pendant la conduite, il enverra un rappel de réduction de vitesse au système 1 et informera le conducteur que le véhicule sur la route défoncée devant rouler roulera lentement, réduisant ainsi les bosses. ou il peut identifier l'emplacement des couloirs de bus et identifier les couloirs de marée, etc.
Idéalement, le système 2 équivaut à avoir un moniteur d’auto-école assis dans le siège du copilote pour surveiller à tout moment le comportement de conduite. Il convient de mentionner que le grand modèle de langage de Xpeng, XBrain, et le grand modèle de perception sémantique de conduite autonome de Haomo ont également des capacités similaires.
Il est rapporté que la quantité idéale de paramètres du modèle VLM atteint 2,2 milliards, et le temps d'inférence du modèle VLM côté véhicule a également été optimisé de 4,1 secondes à 0,3 seconde.
En plus des systèmes doubles, Ideal a également présenté les méthodes de test et de vérification de la solution de bout en bout. L'approche dominante dans l'industrie consiste à effectuer des tests de simulation via un environnement virtuel 3D, une simulation reconstructive, une simulation générative, etc. L’approche idéale consiste à combiner les deux voies techniques de la simulation reconstruite et de la simulation générée, ce qui équivaut à reconstruire des questions réelles et à générer des questions simulées.
En fait, Tesla utilise également de grands modèles pour générer des vidéos continues afin de créer un modèle mondial ; le grand modèle de conduite autonome GAIA-1 de la société de conduite autonome Wayve (qui comporte déjà 9 milliards de paramètres) peut également générer des vidéos de scènes de conduite, décrire des scénarios et faire des prédictions.
En général, l'architecture technique idéale est de déployer des systèmes doubles côté voiture. Le modèle de bout en bout de ONE Model permet à son système de conduite autonome de se comporter comme un conducteur humain expérimenté peut le permettre ; conduite autonome Le système a la même capacité de réflexion logique que les humains, tandis que le modèle mondial fournit un environnement d'apprentissage et d'examen et a la capacité d'itérer rapidement.
Selon Lang Xianpeng, responsable de Lili Intelligent Driving, sa solution de bout en bout a été incubée en interne et a commencé les pré-recherches depuis le second semestre de l'année dernière. Elle a maintenant terminé la vérification du prototype du modèle et le déploiement du réel. Véhicules.
Cependant, cette solution est encore difficile à proposer aux utilisateurs. La solution idéale pour les utilisateurs d'AD Max ce mois-ci est de pousser la solution NOA sans image.
La conduite intelligente inaugure le moment du dépassement
Le « bout en bout » devient une direction importante dans la poursuite de la conduite intelligente par divers constructeurs.
En mars de cette année, Yuanrong Qixing a réussi à mettre le modèle de bout en bout sur le bus ; lorsque Huawei a publié Qiankun 3.0 en avril, il a déclaré que sa technologie avait évolué vers une nouvelle architecture de réseau GOD/PDP pour atteindre planification pré-décisionnelle pour un réseau ; Xpeng 5 En mars, il a été annoncé lors de l'AI DAY que le grand modèle de bout en bout avait été mis en production de masse. De plus, des fabricants comme Weilai, Xiaomi, Xpeng et d'autres fabricants ont ajusté leurs équipes de conduite intelligentes pour réaliser une configuration de bout en bout.
On peut constater que divers fabricants, dont Tesla, explorent actuellement l'orientation technologique de bout en bout. Bien que les options et les voies soient différentes, ce qui est certain, c'est que technologie de bout en bout. est devenue la direction de la conduite intelligente.
Cependant, le bout en bout amplifiera les limites supérieures et inférieures du système de conduite intelligente. Bien qu'il puisse améliorer les capacités de conduite intelligente, il entraîne également des problèmes de sécurité difficiles à résoudre. boîte noire, qui ne peut pas être interprétée, entraîne certains problèmes de sécurité.
Alors que diverses entreprises se disputent l'aménagement, Ideal est le premier constructeur automobile à divulguer ses solutions technologiques de bout en bout, Li Xiang lui-même a dévoilé les deux principaux systèmes lors du Forum de Chongqing le mois dernier, ce qui a suscité de vives discussions dans l'industrie. Cette fois, il a également annoncé l'ensemble des plans d'architecture technique, dont on peut dire qu'ils sont frappants lorsque le fer est chaud.
Étant donné que Lideal ne lancera pas de nouveaux produits au cours du second semestre, sa première production en matière de capacités de conduite intelligente peut non seulement maintenir la popularité de l'entreprise, mais également maintenir la compétitivité de ses produits existants. De plus, la configuration du parcours technologique de bout en bout donne également à Ideal la possibilité de rattraper son retard en matière de capacités de conduite intelligente.
Par rapport à l'approche segmentée de bout en bout adoptée par Huawei, Xiaopeng, etc., le modèle de bout en bout idéal est plus difficile à mettre en œuvre. Combien de temps faut-il pour passer du PPT à la production de masse et comment. Est-ce efficace ? Vous devez toujours maintenir l'observation.
Selon le « Rapport de recherche sur l'industrie de la conduite autonome de bout en bout » publié par Chentao Capital, les solutions modulaires de bout en bout des entreprises nationales de conduite autonome pourraient être mises en production de masse en 2025. C’est un mulet ou un cheval, et l’année prochaine il sera temps de le promener.
Contenu de l'article du rapport
Cet article est réimprimé de Kuai Technology. Les opinions contenues dans l'article ne représentent que les opinions personnelles de l'auteur. Ce site ne stocke que des informations
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!