


Article très bien noté CVPR 2024 : Nouveau cadre d'édition générative GenN2N, unifiant les tâches de conversion NeRF
La rubrique AIxiv de notre site Web est une rubrique sur le contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de notre site Web a reçu plus de 2 000 contenus, couvrant les meilleurs laboratoires de grandes universités et entreprises du monde entier, contribuant ainsi à promouvoir les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. L'adresse e-mail de soumission est liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com.

Adresse papier : https://arxiv.org/abs/2404.02788 Page d'accueil papier : https://xiangyueliu.github.io/GenN2N/ Git Adresse du hub : https://github.com/Lxiangyue/GenN2N Titre de l'article : GenN2N : Generative NeRF2NeRF Translation
Dans la partie centrale de GenN2N, 1) le cadre génératif de 3D VAE-GAN est introduit, en utilisant VAE pour représenter l'ensemble de l'espace d'édition afin d'apprendre toutes les distributions d'édition NeRF 3D possibles correspondant à un ensemble d'images d'édition 2D d'entrée , et utilisez GAN pour fournir une supervision raisonnable pour l'édition de différentes vues de NeRF afin de garantir l'authenticité des résultats de l'édition 2) Utiliser l'apprentissage contrastif pour découpler le contenu d'édition et les perspectives afin de garantir la cohérence de l'édition du contenu entre les différentes perspectives 3) Pendant l'inférence. , l'utilisateur échantillonne simplement au hasard plusieurs codes d'édition à partir du modèle de génération conditionnelle peut générer divers résultats d'édition 3D correspondant à la cible d'édition.
Par rapport aux méthodes SOTA pour diverses tâches d'édition NeRF (ICCV2023 Oral, etc.), GenN2N est supérieure aux méthodes existantes en termes de qualité d'édition, de diversité, d'efficacité, etc.
Nous effectuons d'abord l'édition d'images 2D, puis mettons à niveau ces modifications 2D vers NeRF 3D pour obtenir une conversion générative NeRF en NeRF.
(échantillon négatif) ou l'image modifiée
(échantillon positif) dans les données d'entraînement, nous sélectionnons une image modifiée
de la même perspective à partir des données d'entraînement comme condition, ce qui empêche le Le discriminateur n'est pas gêné par des facteurs de perspective lors de la distinction des échantillons positifs et négatifs.
B
Expériences de comparaison
Notre méthode est comparée qualitativement et quantitativement à SO. Méthodes TA pour diverses tâches NeRF spécifiques ( y compris l'édition basée sur le texte, la colorisation, la super-résolution et l'inpainting, etc.). Les résultats montrent que GenN2N, en tant que cadre général, fonctionne aussi bien ou mieux que SOTA spécifique à une tâche, tandis que les résultats d'édition ont une plus grande diversité (ce qui suit est une comparaison entre GenN2N et Instruct-NeRF2NeRF sur la tâche d'édition NeRF basée sur du texte. ).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Introduction Le 12 septembre, OpenAI a publié une mise à jour intitulée «Apprendre à raisonner avec LLMS». Ils ont introduit le modèle O1, qui est formé en utilisant l'apprentissage du renforcement pour lutter contre les tâches de raisonnement complexes. Ce qui définit ce mod

Introduction La famille des modèles Openai O1 fait progresser considérablement le pouvoir de raisonnement et les performances économiques, en particulier dans la science, le codage et la résolution de problèmes. L'objectif d'Openai est de créer des modèles d'IA et d'O1 toujours plus avancés

Introduction Aujourd'hui, le monde de la gestion des requêtes client évolue à un rythme sans précédent, avec de nouveaux outils faisant les gros titres chaque jour. Les agents du modèle de grande langue (LLM) sont la dernière innovation dans ce contexte, stimulant CU

Introduction L'adoption de l'IA générative peut être un voyage transformateur pour toute entreprise. Cependant, le processus de mise en œuvre du Genai peut souvent être lourd et déroutant. Rajendra Singh Pawar, président et co-fondateur de Niit Lim

Introduction La révolution de l'IA a donné naissance à une nouvelle ère de créativité, où les modèles de texte à l'image redéfinissent l'intersection de l'art, du design et de la technologie. Pixtral 12b et Qwen2-VL-72B sont deux forces pionnières

Introduction Avec l'avancement de l'IA, la recherche scientifique a connu une transformation massive. Des millions d'articles sont publiés chaque année sur différentes technologies et secteurs. Mais, naviguant sur cet océan d'informations à Ret

Introduction Les modèles de grandes langues transforment rapidement les industries - ils alimentent tout, du service client personnalisé en banque à la traduction linguistique en temps réel dans la communication mondiale. Ils peuvent répondre à la quête

Introduction Vous ne voulez pas dépenser de l'argent pour les API ou êtes-vous préoccupé par la vie privée? Ou voulez-vous simplement exécuter des LLM localement? Ne t'inquiète pas; Ce guide vous aidera à construire des agents et des cadres multi-agents avec des LLMs locaux T


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

MantisBT
Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

ZendStudio 13.5.1 Mac
Puissant environnement de développement intégré PHP

Version crackée d'EditPlus en chinois
Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

Listes Sec
SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.