Maison > Article > Périphériques technologiques > Contrôle plus granulaire de l'arrière-plan et du premier plan, édition plus rapide : l'approche en deux étapes de BEVControl
Cet article présentera une méthode pour générer avec précision des images Street View multi-vues grâce à la mise en page BEV Sketch
Dans le domaine de la conduite autonome, la synthèse d'images est largement utilisée pour améliorer les performances des tâches de perception en aval
Dans le domaine de la vision par ordinateur, améliorant la perception Un défi de recherche de longue date en matière de performance des modèles est relevé grâce aux images synthétiques. Dans les systèmes de conduite autonome centrés sur la vision, utilisant des caméras multi-vues, ce problème devient plus important car certaines scènes à longue traîne ne peuvent jamais être collectées
Comme le montre la figure 1(a), la méthode de génération existante saisit le structure BEV de style segmentation sémantique dans le réseau de génération et produit des images multi-vues raisonnables. Lorsqu’elles sont évaluées uniquement sur la base de mesures au niveau de la scène, les méthodes existantes semblent capables de synthétiser des images photoréalistes de vues de rue. Cependant, une fois zoomé, nous avons constaté qu'il ne parvenait pas à produire des détails précis au niveau de l'objet. Dans la figure, nous démontrons une erreur courante des algorithmes de génération de pointe, à savoir que le véhicule généré est complètement orienté dans la direction opposée par rapport à la boîte englobante 3D cible. De plus, la modification de la structure BEV du style de segmentation sémantique est une tâche difficile et nécessite beaucoup de main-d'œuvre.
Par conséquent, nous proposons une méthode en deux étapes appelée BEVControl pour fournir un contrôle géométrique plus fin de l'arrière-plan et du premier plan, comme le montre la figure 1. (b). BEVControl prend en charge la saisie de structure BEV de style croquis, permettant une édition rapide et facile. De plus, notre BEVControl décompose la cohérence visuelle en deux sous-objectifs : la cohérence géométrique entre les vues de rue et la vue à vol d'oiseau via le contrôleur ; la cohérence visuelle entre les vues de rue via le coordinateur
Lien papier :https:// www.php.cn/link/1531beb762df4029513ebf9295e0d34f
Le contenu qui doit être réécrit est : Références
Le contenu qui doit être réécrit est : [1] Swerdlow A, Xu R , Zhou B. Génération d'images Street View à partir d'une vue à vol d'oiseau [J].
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!