Maison > Article > Périphériques technologiques > Forum scientifique de la région de la Grande Baie|Professeur Huang Hui de l'Université de Shenzhen : la perception graphique intelligente résout le problème du « cou coincé » des robots
Le journaliste stagiaire tous médias de Southern Finance Ma Jialu Nansha Report
Le développement ultérieur de l'intelligence robotique est limité par le manque de véritables capacités d'environnement dynamique tridimensionnel. « Le 20 mai, Huang Hui, leader national de l'innovation scientifique et technologique et doyenne de l'École d'informatique et de logiciels de l'Université de Shenzhen, a présenté ses recherches sur la perception graphique intelligente au sous-forum des femmes scientifiques « À sa recherche dans la foule ». " du Greater Bay Area Science Forum. En conséquence, les drones sont utilisés pour effectuer une exploration entièrement automatique et autonome de l'espace tridimensionnel et réaliser une modélisation de plus grande précision avec un volume de données plus petit. Actuellement, cette réalisation occupe une position de leader au niveau international. et peut être utilisé dans des domaines tels que les jumeaux numériques et la fabrication de robots intelligents.
.
Taille de données plus petite, précision plus élevée
L'Institut de physique de l'Académie chinoise des sciences a un jour popularisé la définition du jumeau numérique : jumeau numérique, le nom anglais est Digital Twin (jumeau numérique), également connu sous le nom de cartographie numérique et de mise en miroir numérique. Le jumeau numérique consiste à créer une « copie » numérique basée sur un certain appareil ou système. En termes simples, il s'agit de transformer des objets physiques du monde réel en expériences virtuelles numériques.
Au début de 2023, le « Rapport de recherche sur la carte de l'industrie des villes jumelles numériques (2022) » publié par l'Académie chinoise des technologies de l'information et des communications a observé que le stade de développement de l'industrie des jumeaux numériques de mon pays est dans une période de croissance, le numérique Le marché de la construction de villes jumelées est actif et les entités du marché sont en constante expansion. Les jumeaux numériques peuvent grandement améliorer l'efficacité de la construction et le sens réel du « Metaverse » et constituent une partie importante du « Metaverse ». Avec la popularité du concept de « Metaverse », la technologie de pointe des jumeaux numériques devient de plus en plus répandue. plus familier aux gens.
Dans le passé, les jumeaux de données nécessitaient beaucoup de main d'œuvre et de ressources matérielles pour collecter des données, puis utilisaient beaucoup de calculs pour construire des modèles. Huang Hui a souligné que les coûts de collecte de données sont élevés, que les délais sont faibles et que les objets de modélisation 3D ne sont ni structurés ni corrélés, ce qui constitue des problèmes qui font qu'il est difficile pour les jumeaux numériques actuels d'être intelligents, modulaires, légers, structurés et universels.
En réponse aux problèmes ci-dessus, au cours des dix dernières années, Huang Hui s'est concentré sur « les graphiques intelligents et l'informatique perceptuelle » pour surmonter les difficultés, et a pris l'initiative de proposer la technologie de photogrammétrie de précision Usee pour collecter entièrement automatiquement des images urbaines avec Résolution haute définition au niveau millimétrique grâce à des drones portables. Instantanés tridimensionnels, l'ensemble du processus est continuellement planifié et externalisé de bout en bout, en utilisant le moins d'angles de vision pour rechercher une couverture maximale, réduisant ainsi la quantité de données de scènes urbaines à grande échelle. de 200 fois, tout en garantissant une perte de détails géométriques inférieure à 0,6 mètre, ce qui rend la collecte de données plus efficace. L'investissement en équipement peut être réduit de 70 %. Obtenez une cartographie précise de plusieurs informations et d’un métabolisme bénin. Cette technologie a été largement utilisée dans un seul projet de levé aérien tridimensionnel urbain de haute précision et rapproché, et la zone de couverture maintient une position de leader international dans le monde.
Prenons l'exemple de la modélisation d'environ 2 200 kilomètres carrés de la ville de Shenzhen. Dans la pratique, la modélisation est confrontée aux défis d'une coordination difficile de l'espace aérien, de nombreuses restrictions d'altitude, d'effets météorologiques fréquents, d'une mauvaise qualité des données et d'un long temps de collecte. Si la méthode de modélisation traditionnelle est utilisée, il faudra 2 ans pour collecter les données de 60 millions d'images et construire un modèle de 60 To, pour un coût total de 150 millions. La mise à jour en temps réel de la base tridimensionnelle de la ville jumelle ne peut pas être réalisée car la méthode de collecte a un cycle long et une faible fréquence. Après optimisation de la technologie de photogrammétrie de précision d'Ushi, il est possible de construire un petit modèle de 6 To en utilisant 20 millions de données photo en 8 mois sans réduire la précision, et le coût total est réduit à 60 millions, soit une réduction de 60 %.
Les jumeaux numériques ont une valeur et une importance importantes dans les domaines de l'intelligence en essaim, de la conduite sans conducteur, des villes intelligentes, de la sécurité intérieure, de la fabrication industrielle et d'autres domaines. « Huang Hui a déclaré que la technologie de photogrammétrie de précision de Youshi utilise des drones pour effectuer une exploration entièrement automatique et indépendante de l'espace tridimensionnel et réalise le cloud computing, ce qui réduit considérablement le coût et le seuil de la reconstruction urbaine tridimensionnelle. cartes de conduite intelligentes de précision à l'avenir. Construction, navigation tridimensionnelle réelle, plate-forme d'informations de gestion urbaine de haute précision et autres domaines
.Le manque de capacité de perception tridimensionnelle "a coincé le cou du robot"
Le « Rapport de recherche sur la carte de l'industrie des villes jumelles numériques (2022) » propose que la technologie de l'intelligence artificielle a été progressivement appliquée au domaine de la modélisation ces dernières années, et que la modélisation d'images et la modélisation vidéo sont devenues des tendances de développement futures. Selon Huang Hui, l'application de l'intelligence artificielle pour aider la recherche sur les robots pourrait améliorer l'efficacité de l'analyse des données et aider à trouver des solutions de modélisation tridimensionnelles plus efficaces. Elle a révélé qu'elle et son équipe étudiaient des méthodes permettant de combiner les graphiques intelligents et l'intelligence artificielle pour faire progresser la recherche sur les robots intelligents.
Un défi pour la perception des graphiques intelligents est le manque de données disponibles pour une formation à grande échelle, par rapport à ChatGPT. Huang Hui a déclaré que les données originales utilisées par ChatGPT ont été essentiellement filtrées et annotées manuellement et sont « propres ». Cependant, lorsque cela s'étend à l'espace tridimensionnel, la difficulté augmentera considérablement. Un objet peut être photographié 1 000 fois, mais les 1 000 photos peuvent ne pas décrire l’objet de manière complète et précise. Reformulé comme suit : cela signifie que lors de la formation d'un modèle d'intelligence artificielle pour traiter des données spatiales tridimensionnelles à petite échelle, il devra traiter une grande quantité de données.
L'intelligence des robots est bloquée en raison du manque de véritables capacités d'environnement dynamique tridimensionnel. "Pourquoi est-ce si difficile ? Huang Hui a utilisé l'analogie d'un robot de balayage ordinaire pour expliquer : il n'est pas facile maintenant de faire bouger un robot de balayage sur une surface plane, de détecter et d'éviter les obstacles, et de s'empêcher de se coincer. Par rapport à il, perception graphique intelligente Il est nécessaire d'être capable de juger la forme des objets dans l'espace tridimensionnel, puis de juger les fonctions et les relations dynamiques et statiques des objets. Il est nécessaire de donner aux robots une intelligence incarnée capable d'atteindre un niveau supérieur. perception, et être capable de véritablement faire face et de changer l'environnement dynamique complexe tridimensionnel réel, et de « voir » comme les humains, c'est-à-dire comprendre que ce que vous voyez est ce que vous obtenez », prendre des décisions et des actions.
Après plus de 20 ans de recherche fondamentale, Huang Hui a dirigé l'équipe pour tenter d'unifier toute la chaîne de la perception environnementale, de la modélisation géométrique, de la compréhension sémantique et de la prise de décision autonome. Cependant, par rapport aux technologies d'intelligence artificielle telles que ChatGPT, qui ont fait des progrès significatifs dans la compréhension du langage naturel, de nombreuses questions scientifiques clés restent encore à résoudre et « il reste encore un long chemin à parcourir ».Pour plus de contenu, veuillez télécharger l'application 21 Finance
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!