recherche
MaisonPériphériques technologiquesIALorsque « tout diviser » rencontre la réparation d'image : pas besoin de marquage précis, cliquez sur l'objet pour réaliser la suppression de l'objet, le remplissage du contenu et le remplacement de la scène.

Début avril, Meta a publié le premier modèle de segmentation d'images de base de l'histoire - SAM (Segment Anything Model) [1]. En tant que modèle de segmentation, SAM possède des fonctionnalités puissantes et est très convivial. Par exemple, si l'utilisateur clique simplement pour sélectionner l'objet correspondant, l'objet sera segmenté immédiatement et le résultat de la segmentation est très précis. Au 15 avril, le référentiel GitHub de SAM comptait 26 000 étoiles.

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Comment faire bon usage d'un modèle aussi puissant de « tout diviser » et l'étendre à des scénarios d'application avec des besoins plus pratiques est crucial. Par exemple, quel genre d'étincelles émergeront lorsque SAM répondra à des tâches pratiques d'inpainting d'images (Image Inpainting) ?

L'équipe de recherche de l'Université des sciences et technologies de Chine et de l'Institut oriental de technologie a donné une réponse étonnante. Basé sur SAM, ils ont proposé le modèle « Inpaint Anything » (IA). Différent des modèles de réparation d'images traditionnels, le modèle IA ne nécessite pas d'opérations détaillées pour générer des masques et prend en charge le marquage des objets sélectionnés en un seul clic. IA peut réaliser supprimer n'importe quoi (Supprimer n'importe quoi), tout remplir (Remplir n'importe quoi), remplacer n'importe quoi. couvre une variété de scénarios d'application typiques de réparation d'images, notamment la suppression de cible, le remplissage de cible, le remplacement d'arrière-plan, etc.

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

  • Lien papier : http://arxiv.org/abs/2304.06790
  • Lien de la bibliothèque de codes : https://github.com/geekyutao/Inpaint-Anything

Introduction à la méthode

Bien que les systèmes actuels d'inpainting d'images aient fait des progrès significatifs, ils sont toujours confrontés à des difficultés pour sélectionner les images de masque et combler les trous. Sur la base de SAM, les chercheurs ont essayé pour la première fois la réparation d'images sans masque et ont construit un nouveau paradigme de réparation d'image « Cliquer et remplir », qu'ils ont appelé tout patcher (Inpaint Anything) (IA). L'idée principale derrière IA est de combiner les avantages de différents modèles pour créer un système de réparation d'images puissant et convivial .

IA a trois fonctions principales : (i) Supprimer n'importe quoi : les utilisateurs n'ont qu'à cliquer sur l'objet qu'ils souhaitent supprimer, et IA supprimera l'objet sans laisser de trace, obtenant ainsi une "élimination magique" efficace (ii) Remplissez n'importe quoi : en même temps, l'utilisateur peut indiquer en outre à IA ce qu'il souhaite remplir dans l'objet via une invite de texte (invite de texte), et IA pilotera ensuite le modèle AIGC (AI-Generated Content) intégré (tel que la diffusion stable [2]) génère les objets remplis de contenu correspondants pour réaliser une « création de contenu » à volonté ; (iii) Remplacer n'importe quoi : l'utilisateur peut également cliquer pour sélectionner les objets qui doivent être conservés et utiliser des invites textuelles pour indiquer à IA ce qu'il veut. Vous pouvez remplacer l'arrière-plan de l'objet par le contenu spécifié pour obtenir une « transformation d'environnement » éclatante. Le cadre global de l'IA est présenté dans la figure ci-dessous :

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Diagramme Inpaint Anything (IA). Les utilisateurs peuvent sélectionner n'importe quel objet dans l'image en cliquant dessus. En tirant parti de modèles de vision puissants tels que SAM [1], LaMa [3] et Stable Diffusion (SD) [3], IA est capable de supprimer en douceur les objets sélectionnés (c'est-à-dire de supprimer n'importe quoi). De plus, en saisissant des invites de texte dans IA, l'utilisateur peut remplir l'objet avec n'importe quel contenu souhaité (c'est-à-dire, remplir n'importe quoi) ou remplacer arbitrairement l'objet de l'objet (c'est-à-dire, remplacer n'importe quoi).

Supprimez tout

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Schéma de principe de Supprimer n'importe quoi

Les étapes pour "Supprimer tout" sont les suivantes :

  • Étape 1 : L'utilisateur clique sur l'objet qu'il souhaite supprimer ;
  • Étape 2 : SAM segmente l'objet ;
  • Étape 3 : Le modèle d'inpainting d'image (LaMa) remplit l'objet.

Fill Anything

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Fill Anything diagramme, l'invite de texte utilisée dans l'image : un ours en peluche sur un banc

« Remplissez tout » Les étapes sont les suivantes :

    Étape 1 : L'utilisateur clique sur l'objet qu'il souhaite supprimer
  • Étape 2 : SAM segmente l'objet
  • Étape 3 : L'utilisateur exprime ses pensées à travers le contenu textuel ; à remplir ;
  • Étape 4 : Le modèle d'inpainting d'image basé sur une invite de texte (Diffusion stable) remplit l'objet en fonction du texte fourni par l'utilisateur.
REPLACEZ QUELQUE CHOSE SICHAGNE DE TEMPS, l'invite de texte utilisée dans l'image: Un homme en bureau

"Remplissez tout" les étapes sont les suivantes: Étape 1 : L'utilisateur clique sur l'objet qu'il souhaite supprimer ;

Étape 2 : SAM segmente l'objet

  • Étape 3 : L'utilisateur indique le fond qu'il souhaite remplacer par le biais du texte ; : Le modèle d'inpainting d'image basé sur des invites de texte (Stable Diffusion) remplace l'arrière-plan de l'objet en fonction du texte fourni par l'utilisateur.
  • Résultats du modèle
  • Les chercheurs ont ensuite testé Inpaint Anything sur l'ensemble de données COCO [4], l'ensemble de données de test LaMa [3] et leurs propres images 2K HD prises avec leurs téléphones portables. Il convient de noter que le modèle du chercheur prend également en charge les images haute définition 2K et tous les formats d’image, ce qui permet des applications de migration efficaces du système IA dans divers environnements d’intégration et cadres existants.
  • Supprimer tous les résultats expérimentaux

Remplir tous les résultats expérimentaux

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.Invite textuelle : un objectif d'appareil photo dans la main

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Invite de texte : un porte-avions sur la mer

Invite de texte : une peinture de Picasso sur le mur

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Remplacer tous les résultats expérimentaux

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Invite texte : asseyez-vous sur la balançoire

Invite texte : petit-déjeuner

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

Invite texte : un bus, au centre d'une route de campagne, l'été

Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène. "Invite de texte : carrefour dans la ville" . Inpaint Anything (IA) proposé par le projet est un système de réparation d'images multifonctionnel qui intègre la suppression d'objets, le remplissage de contenu, le remplacement de scènes et d'autres fonctions (d'autres fonctions sont en route, alors restez à l'écoute).

IA combine des modèles visuels de base tels que SAM, des modèles de réparation d'image (tels que LaMa) et des modèles AIGC (tels que Stable Diffusion) pour réaliser une réparation d'image conviviale sans masque, et prend également en charge « cliquer pour supprimer, remplissage rapide » et d'autres opérations humanisées « de style idiot ». De plus, IA peut traiter des images avec des formats d’image arbitraires et une résolution HD 2K, quel que soit le contenu original de l’image.

Actuellement, le Lorsque « tout diviser » rencontre la réparation dimage : pas besoin de marquage précis, cliquez sur lobjet pour réaliser la suppression de lobjet, le remplissage du contenu et le remplacement de la scène.

projet est entièrement open source

. Enfin, tout le monde est invité à partager et à promouvoir Inpaint Anything (IA), et j'ai hâte de voir d'autres nouveaux projets basés sur IA. À l'avenir, les chercheurs exploreront davantage le potentiel d'Inpaint Anything (IA) pour prendre en charge de nouvelles fonctions plus pratiques, telles que la découpe d'image à granularité fine, l'édition, etc., et l'appliquer à des applications plus réelles.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer
Comment construire votre assistant d'IA personnel avec HuggingFace SmollmComment construire votre assistant d'IA personnel avec HuggingFace SmollmApr 18, 2025 am 11:52 AM

Exploiter la puissance de l'IA sur disvise: construire une CLI de chatbot personnelle Dans un passé récent, le concept d'un assistant d'IA personnel semblait être une science-fiction. Imaginez Alex, un passionné de technologie, rêvant d'un compagnon d'IA intelligent et local - celui qui ne dépend pas

L'IA pour la santé mentale est attentivement analysée via une nouvelle initiative passionnante à l'Université de StanfordL'IA pour la santé mentale est attentivement analysée via une nouvelle initiative passionnante à l'Université de StanfordApr 18, 2025 am 11:49 AM

Leur lancement inaugural de l'AI4MH a eu lieu le 15 avril 2025, et le Dr Tom Insel, M.D., célèbre psychiatre et neuroscientifique, a été le conférencier de lancement. Le Dr Insel est réputé pour son travail exceptionnel dans la recherche en santé mentale et la techno

La classe de draft de la WNBA 2025 entre dans une ligue qui grandit et luttant sur le harcèlement en ligneLa classe de draft de la WNBA 2025 entre dans une ligue qui grandit et luttant sur le harcèlement en ligneApr 18, 2025 am 11:44 AM

"Nous voulons nous assurer que la WNBA reste un espace où tout le monde, les joueurs, les fans et les partenaires d'entreprise, se sentent en sécurité, appréciés et autonomes", a déclaré Engelbert, abordé ce qui est devenu l'un des défis les plus dommageables des sports féminins. L'anno

Guide complet des structures de données intégrées Python - Analytics VidhyaGuide complet des structures de données intégrées Python - Analytics VidhyaApr 18, 2025 am 11:43 AM

Introduction Python excelle comme un langage de programmation, en particulier dans la science des données et l'IA générative. La manipulation efficace des données (stockage, gestion et accès) est cruciale lorsqu'il s'agit de grands ensembles de données. Nous avons déjà couvert les nombres et ST

Premières impressions des nouveaux modèles d'Openai par rapport aux alternativesPremières impressions des nouveaux modèles d'Openai par rapport aux alternativesApr 18, 2025 am 11:41 AM

Avant de plonger, une mise en garde importante: les performances de l'IA sont non déterministes et très usagées. En termes plus simples, votre kilométrage peut varier. Ne prenez pas cet article (ou aucun autre) article comme le dernier mot - au lieu, testez ces modèles sur votre propre scénario

Portfolio AI | Comment construire un portefeuille pour une carrière en IA?Portfolio AI | Comment construire un portefeuille pour une carrière en IA?Apr 18, 2025 am 11:40 AM

Construire un portefeuille AI / ML hors concours: un guide pour les débutants et les professionnels La création d'un portefeuille convaincant est cruciale pour sécuriser les rôles dans l'intelligence artificielle (IA) et l'apprentissage automatique (ML). Ce guide fournit des conseils pour construire un portefeuille

Ce que l'IA agentique pourrait signifier pour les opérations de sécuritéCe que l'IA agentique pourrait signifier pour les opérations de sécuritéApr 18, 2025 am 11:36 AM

Le résultat? L'épuisement professionnel, l'inefficacité et un écart d'élargissement entre la détection et l'action. Rien de tout cela ne devrait être un choc pour quiconque travaille en cybersécurité. La promesse d'une IA agentique est devenue un tournant potentiel, cependant. Cette nouvelle classe

Google contre Openai: la lutte contre l'IA pour les étudiantsGoogle contre Openai: la lutte contre l'IA pour les étudiantsApr 18, 2025 am 11:31 AM

Impact immédiat contre partenariat à long terme? Il y a deux semaines, Openai s'est avancé avec une puissante offre à court terme, accordant aux étudiants des États-Unis et canadiens d'accès gratuit à Chatgpt Plus jusqu'à la fin mai 2025. Cet outil comprend GPT - 4O, un A

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Outils chauds

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

MinGW - GNU minimaliste pour Windows

MinGW - GNU minimaliste pour Windows

Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

mPDF

mPDF

mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) ​​et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP