recherche
MaisonPériphériques technologiquesIALa technologie de base de Byte AI Lab a remporté le championnat de navigation active Habitat Challenge 2022, qui combine méthodes traditionnelles et apprentissage par imitation.

Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航

La navigation d'objets est l'une des tâches de base des robots intelligents. Dans cette tâche, le robot intelligent explore et trouve activement certains types d'objets désignés par les humains dans un nouvel environnement inconnu. La tâche de navigation vers la cible de l'objet est orientée vers les besoins d'application des futurs robots de service à domicile. Lorsque les personnes ont besoin du robot pour effectuer certaines tâches, comme obtenir un verre d'eau, le robot doit d'abord trouver et se déplacer vers l'emplacement du gobelet d'eau. , puis aidez les gens à obtenir la tasse d'eau.

Habitat Challenge Le challenge est organisé conjointement par Meta AI et d'autres institutions. C'est l'un des événements les plus connus dans le domaine de la navigation par cible d'objets. Depuis 2022, il a lieu pendant 4 années consécutives. ans. Au total, 54 équipes ont participé à cette compétition. Lors du concours, des chercheurs de l'équipe ByteDance AI Lab-Research ont proposé un nouveau cadre de navigation entre cibles d'objets pour combler les lacunes des méthodes existantes. Ce cadre combine intelligemment l'apprentissage par imitation avec les méthodes traditionnelles pour se démarquer et remporter le championnat. Des résultats qui ont largement dépassé les résultats de la deuxième place et des autres équipes participantes dans la métrique clé SPL. Historiquement, les équipes championnes de cet événement sont généralement des instituts de recherche bien connus tels que la CMU, l'UC Berkerly et Facebook.

Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航

Test-Standard list

Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航

Test-Challenge list #🎜 🎜#

Site officiel du concours Habitat Challenge : https://aihabitat.org/challenge/2022/

Habitat Challenge Competition LeaderBoard : https://eval.ai/web/challenges/ challenge -page/1615/leaderboard

1. Motivation de recherche

Les méthodes actuelles de navigation vers les cibles d'objets peuvent être grossièrement divisées en deux catégories : les méthodes de bout en bout et les méthodes basées sur des cartes. . La méthode de bout en bout extrait les caractéristiques des données d'entrée du capteur, puis les alimente dans un modèle d'apprentissage profond pour obtenir l'action. Ces méthodes sont généralement basées sur l'apprentissage par renforcement ou l'apprentissage par imitation (Figure 1, méthodes sans carte) ; Les méthodes basées sur la carte construisent généralement une carte explicite ou implicite, puis sélectionnent un point cible sur la carte via l'apprentissage par renforcement et d'autres méthodes, et enfin planifient le chemin et obtiennent l'action (Figure 1 Méthode basée sur la carte).

Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航

Figure 1 Organigramme de la méthode de bout en bout (en haut) et de la méthode basée sur une carte (en bas) # 🎜🎜 #Après un grand nombre d'expérimentations comparant les deux méthodes, les chercheurs ont constaté que les deux méthodes ont leurs propres avantages et inconvénients : la méthode de bout en bout ne nécessite pas la construction d'une carte de l'environnement, il est donc plus concis et a une capacité de généralisation dans différents scénarios. Cependant, comme le réseau a besoin d'apprendre les informations spatiales de l'environnement de codage, il s'appuie sur une grande quantité de données d'entraînement et il est difficile d'apprendre certains comportements simples en même temps, comme s'arrêter près de l'objet cible. Les méthodes basées sur des cartes utilisent des rasters pour stocker des caractéristiques ou de la sémantique et disposer d'informations spatiales explicites, de sorte que le seuil d'apprentissage pour ce type de comportement est plus faible. Cependant, cela dépend fortement de résultats de positionnement précis et, dans certains environnements tels que les escaliers, une conception artificielle de la perception et des stratégies de planification de chemin sont nécessaires.

Sur la base des conclusions ci-dessus, les chercheurs de l'équipe ByteDance AI Lab-Research espèrent combiner les avantages des deux méthodes. Cependant, les processus algorithmiques de ces deux méthodes sont très différents et difficiles à combiner directement ; de plus, il est également difficile de concevoir une stratégie pour intégrer directement les résultats des deux méthodes ; Par conséquent, les chercheurs ont conçu une stratégie simple mais efficace qui permet aux deux types de méthodes de mener alternativement une exploration active et une recherche d'objets en fonction de l'état du robot, maximisant ainsi leurs avantages respectifs.

2. Méthode de compétition

L'algorithme se compose principalement de deux branches : la branche basée sur la carte de probabilité et la branche de bout en bout. L'entrée de l'algorithme est l'image RVB-D de première vue et la pose du robot, ainsi que la catégorie d'objet cible à trouver, et la sortie est l'action suivante (action). L'image RVB est segmentée en première instance et transmise aux deux branches avec d'autres données d'entrée brutes. Les deux branches produisent respectivement leurs propres actions, et une stratégie de commutation détermine l'action de sortie finale.

Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航

Figure 2 Diagramme de flux de l'algorithme

La branche basée sur la carte de probabilité

La branche basée sur la carte de probabilité s'inspire de l'idée de la carte de liaison sémantique[2] et simplifie la méthode de l'article original de l'auteur[3] publié lors de la conférence IROS Robot . Cette branche construit une carte sémantique 2D basée sur les résultats de segmentation de l'instance d'entrée, la carte de profondeur et la pose du robot. D'autre part, elle met à jour une carte de probabilité basée sur les probabilités d'association pré-appris entre les objets.

Les méthodes de mise à jour de la carte de probabilité sont les suivantes : lorsque l'objet cible est détecté mais pas suffisamment fiable (le score de confiance est inférieur au seuil), vous devez continuer à observer de plus près à ce moment-là, donc la valeur de probabilité de la zone correspondante sur la carte de probabilité devrait augmenter (comme le montre la partie supérieure de la figure 3) ; de la même manière, si des objets liés à l'objet cible sont détectés (par exemple, la probabilité que des tables et des chaises soient placées ensemble est relativement élevée) ; de la zone correspondante augmentera également (comme le montre la partie inférieure de la figure 3 illustrée). En sélectionnant la zone avec la probabilité la plus élevée comme point cible, l'algorithme encourage le robot à s'approcher des objets cibles potentiels et des objets associés pour une observation plus approfondie jusqu'à ce qu'il trouve un objet cible avec une probabilité de confiance supérieure au seuil.

Habitat Challenge 2022冠军技术:字节AI Lab提出融合传统和模仿学习的主动导航

Figure 3 Diagramme schématique de la méthode de mise à jour de la carte de probabilité

Branche de bout en bout

L'entrée de la branche de bout en bout comprend des images RVB-D, des résultats de segmentation d'instance, un robot poses, catégories d'objets cibles et action de sortie directe. La fonction principale de la branche de bout en bout est de guider le robot pour trouver des objets comme les humains, c'est pourquoi le modèle et le processus de formation de la méthode Habitat-Web[4] sont adoptés. La méthode est basée sur l'apprentissage par imitation, où le réseau est formé en collectant des exemples d'humains recherchant des objets dans un ensemble de formation.

Stratégie de commutation

La stratégie de commutation sélectionne principalement l'une des deux actions produites par la branche de la carte de probabilité et la branche de bout en bout comme sortie finale en fonction des résultats de la carte de probabilité et de la planification du chemin. Lorsqu'il n'y a pas de raster avec une probabilité supérieure au seuil dans la carte de probabilité, le robot doit explorer l'environnement ; lorsqu'un chemin réalisable ne peut pas être planifié sur la carte, le robot peut se trouver dans certains environnements spéciaux (tels que des escaliers). Dans les deux cas, des méthodes de bout en bout seront utilisées. Le branchement de bout en bout permet au robot d'avoir une adaptabilité environnementale suffisante. Dans d'autres cas, la branche de la carte probabiliste est sélectionnée pour tirer pleinement parti de ses avantages dans la recherche d'objets cibles.

L'effet de cette stratégie de commutation est montré dans la vidéo. Le robot utilise généralement la branche de bout en bout pour explorer efficacement l'environnement une fois qu'un objet cible possible ou un objet associé est découvert, il passe à la branche de carte de probabilité pour. observation plus rapprochée. Si l'objet cible est Si la probabilité de confiance est supérieure au seuil, il s'arrêtera à l'objet cible, sinon la valeur de probabilité dans la zone continuera à diminuer jusqu'à ce qu'il n'y ait plus de grilles avec une probabilité supérieure au seuil ; , et le robot reviendra de bout en bout pour continuer l'exploration.

Comme le montre la vidéo, cette méthode combine les avantages de l'approche de bout en bout et de l'approche basée sur la carte. Les deux branches remplissent leurs propres tâches. La méthode de bout en bout est principalement chargée de l'exploration de l'environnement ; la branche des cartes de probabilité est chargée d'observer à proximité de la zone d'intérêt. Par conséquent, cette méthode peut non seulement explorer des scènes complexes (telles que des escaliers), mais également réduire les exigences de formation de la branche de bout en bout.

3. Résumé

Pour la tâche de navigation de cible active d'objet, l'équipe de recherche ByteDance AI Lab a proposé un cadre qui combine des cartes de probabilité classiques avec un apprentissage par imitation moderne. Ce cadre est une tentative réussie de combiner les méthodes traditionnelles avec une approche de bout en bout. Lors du concours Habitat, la méthode proposée par l'équipe ByteDance AI Lab-Research a largement dépassé les résultats de la deuxième place et des autres équipes participantes, prouvant l'avancée de l'algorithme. En introduisant des méthodes traditionnelles dans la méthode de bout en bout actuelle de l'IA incorporée, nous pouvons combler davantage certaines lacunes de la méthode de bout en bout, permettant ainsi aux robots intelligents d'aller plus loin sur la voie de l'aide et du service aux gens.

Récemment, les recherches de l'équipe de recherche du ByteDance AI Lab dans le domaine de la robotique ont également été incluses dans les principales conférences sur la robotique telles que CoRL, IROS et ICRA, notamment l'estimation de la pose d'objets, la saisie d'objets, la navigation de cibles, l'assemblage automatique et l'humain. interaction informatique et autres tâches essentielles des robots.

【CoRL 2022】Estimation générative de forme et de pose au niveau de la catégorie avec des primitives sémantiques

  • Adresse papier : https://arxiv.org/abs/2210.01112

【IROS 2022】Génération d'assemblages de pièces 3D avec transformateur codé par instance

  • Adresse papier : https://arxiv.org/abs/2207.01779

【IROS 2022】Navigation vers des objets dans des environnements invisibles par prévision de distance

  • Adresse papier : https://arxiv.org/abs/2202.03735

【EMNLP 2022】Vers une génération et une compréhension unificatrices d'expressions de référence

  • Adresse papier : https://arxiv.org/pdf/2210.13076

【ICRA 2022】Apprentissage de la conception et de la construction avec des matériaux de tailles variables via des réinitialisations de mémoire prioritaires

  • Adresse papier : https://arxiv.org/abs/2204.05509

【IROS 2021】Apprentissage simultané de la sémantique et des collisions pour 6-DoF Grasp Pose Estimation

  • Adresse papier : https://arxiv.org/abs/2108.02425

【IROS 2021】Apprendre à concevoir et construire un pont sans plan

  • Adresse papier : https://arxiv.org/abs /2108.02439

4. Références

[1] Yadav, Karmesh, et al. "Ensemble de données sémantiques 3D d'Habitat-Matterport." et Odest Chadwicke Jenkins. « Cartes de liaison sémantique pour la recherche active d'objets visuels. » Conférence internationale de l'IEEE 2020 sur la robotique et l'automatisation (IEEE, 2020).

[3] Minzhao Zhu, Binglei Zhao et Tao Kong « Naviguer vers. Objets dans des environnements invisibles par prévision de distance."

préimpression arXiv arXiv:2202.03735

(2022).[4] Ramrakhya, Ram, et al. "Habitat-Web : apprentissage de stratégies de recherche d'objets incorporées à partir de démonstrations humaines à grande échelle". Actes de la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance de formes 2022.

5. À propos de nous

ByteDance AI Lab NLP&Research se concentre sur la recherche technologique de pointe dans le domaine de l'intelligence artificielle, couvrant le traitement du langage naturel, la robotique, etc. . domaine de recherche technologique, et s'engage à mettre en pratique les résultats de la recherche et à fournir un support technique et des services de base pour les produits et activités existants de l'entreprise. Les capacités techniques de l'équipe sont ouvertes au monde extérieur grâce au Volcano Engine, favorisant l'innovation en matière d'IA.

ByteDance AI-Lab NLP&Research Coordonnées

Consultation de recrutement : fankaijing@bytedance.com
  • Coopération académique : luomanping@bytedance.com

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer
Gemma Scope: le microscope de Google pour regarder dans le processus de pensée de l'IAGemma Scope: le microscope de Google pour regarder dans le processus de pensée de l'IAApr 17, 2025 am 11:55 AM

Explorer le fonctionnement interne des modèles de langue avec Gemma Scope Comprendre les complexités des modèles de langue IA est un défi important. La sortie de Google de Gemma Scope, une boîte à outils complète, offre aux chercheurs un moyen puissant de plonger

Qui est un analyste de Business Intelligence et comment en devenir un?Qui est un analyste de Business Intelligence et comment en devenir un?Apr 17, 2025 am 11:44 AM

Déverrouiller le succès de l'entreprise: un guide pour devenir un analyste de Business Intelligence Imaginez transformer les données brutes en informations exploitables qui stimulent la croissance organisationnelle. C'est le pouvoir d'un analyste de Business Intelligence (BI) - un rôle crucial dans GU

Comment ajouter une colonne dans SQL? - Analytique VidhyaComment ajouter une colonne dans SQL? - Analytique VidhyaApr 17, 2025 am 11:43 AM

Instruction ALTER TABLE de SQL: Ajout de colonnes dynamiquement à votre base de données Dans la gestion des données, l'adaptabilité de SQL est cruciale. Besoin d'ajuster votre structure de base de données à la volée? L'énoncé de la table alter est votre solution. Ce guide détaille l'ajout de Colu

Analyste d'entreprise vs analyste de donnéesAnalyste d'entreprise vs analyste de donnéesApr 17, 2025 am 11:38 AM

Introduction Imaginez un bureau animé où deux professionnels collaborent sur un projet critique. L'analyste commercial se concentre sur les objectifs de l'entreprise, l'identification des domaines d'amélioration et la garantie d'alignement stratégique sur les tendances du marché. Simulé

Que sont le comte et le coude à Excel? - Analytique VidhyaQue sont le comte et le coude à Excel? - Analytique VidhyaApr 17, 2025 am 11:34 AM

Excel Counting and Analysis: Explication détaillée du nombre et des fonctions de compte Le comptage et l'analyse des données précises sont essentiels dans Excel, en particulier lorsque vous travaillez avec de grands ensembles de données. Excel fournit une variété de fonctions pour y parvenir, les fonctions Count et Count sont des outils clés pour compter le nombre de cellules dans différentes conditions. Bien que les deux fonctions soient utilisées pour compter les cellules, leurs cibles de conception sont ciblées sur différents types de données. Faisons des détails spécifiques du comptage et des fonctions de coude, mettons en évidence leurs caractéristiques et différences uniques et apprenez à les appliquer dans l'analyse des données. Aperçu des points clés Comprendre le nombre et le cou

Chrome est là avec l'IA: vivre quelque chose de nouveau tous les jours !!Chrome est là avec l'IA: vivre quelque chose de nouveau tous les jours !!Apr 17, 2025 am 11:29 AM

La révolution de l'IA de Google Chrome: une expérience de navigation personnalisée et efficace L'intelligence artificielle (IA) transforme rapidement notre vie quotidienne, et Google Chrome mène la charge dans l'arène de navigation Web. Cet article explore les exciti

Côté humain de l'AI: le bien-être et le quadruple de basCôté humain de l'AI: le bien-être et le quadruple de basApr 17, 2025 am 11:28 AM

Réinventuation d'impact: le quadruple bas Pendant trop longtemps, la conversation a été dominée par une vision étroite de l’impact de l’IA, principalement axée sur le résultat du profit. Cependant, une approche plus holistique reconnaît l'interconnexion de BU

5 cas d'utilisation de l'informatique quantique qui change la donne que vous devriez connaître5 cas d'utilisation de l'informatique quantique qui change la donne que vous devriez connaîtreApr 17, 2025 am 11:24 AM

Les choses évoluent régulièrement vers ce point. L'investissement affluant dans les prestataires de services quantiques et les startups montre que l'industrie comprend son importance. Et un nombre croissant de cas d'utilisation réels émergent pour démontrer sa valeur

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Version Mac de WebStorm

Version Mac de WebStorm

Outils de développement JavaScript utiles

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

Télécharger la version Mac de l'éditeur Atom

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

DVWA

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

Navigateur d'examen sécurisé

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.