Maison >développement back-end >Tutoriel Python >Déverrouiller le traitement d'image alimenté par AI sur votre ordinateur portable avec une diffusion stable V - C'est plus facile que vous ne le pensez!
Ce script Python utilise la bibliothèque de diffuseurs Face Hugging Face pour générer des variations d'une image d'entrée à l'aide de diffusion stable v1.5. C'est un outil puissant pour la manipulation d'images, permettant aux utilisateurs de transformer des images en fonction des invites de texte.
Le script commence par définir une fonction load_image
. Cette fonction gère à la fois les chemins d'image locaux et les URL, garantissant la compatibilité avec diverses sources d'entrée. Il convertit les images en RVB, les redimensionne tout en préservant le rapport d'aspect et les remplissait d'une taille 768x768 cohérente pour le traitement par le modèle de diffusion stable.
La fonctionnalité principale réside dans generate_image_variation
. Cette fonction initialise le pipeline IMG2IMG de diffusion stable, spécifiant l'ID de modèle, le périphérique (CUDA si disponible, sinon CPU) et le type de données pour des performances optimales. Il charge ensuite l'image d'entrée prétraitée et utilise le pipeline pour générer des variations d'image en fonction de l'invite de texte fournie. Des paramètres clés comme strength
(contrôler le niveau de transformation) et guidance_scale
(influencer la façon dont la sortie adhère à l'invite) permet un contrôle à grain fin sur le processus de génération d'images. La fonction permet également de définir une graine aléatoire pour la reproductibilité.
Enfin, save_generated_images
enregistre les images générées au répertoire images-out
avec numérotation séquentielle.
L'utilisation de l'exemple montre comment utiliser le script. Il définit un chemin d'image d'entrée (ou URL), une invite de texte ("dessiner l'image dans le style d'art moderne, photoréaliste et détaillé.") Et d'autres paramètres. Il appelle ensuite generate_image_variation
pour créer trois variations et les enregistre en utilisant save_generated_images
.
Forces:
strength
, guidance_scale
, et le nombre d'images générées pour affiner la sortie. seed
garantit que les mêmes résultats peuvent être obtenus à plusieurs reprises. Faiblesses:
Exemple de cas d'utilisation et de résultats:
L'exemple fourni transforme une image à l'aide d'une invite de style artistique spécifique. Les images avant et après illustrent la capacité du script à modifier le style et l'apparence d'une image en fonction d'une description textuelle. Les résultats démontrent visuellement l'efficacité du modèle de diffusion stable et la capacité du script à l'intégrer pour la manipulation d'image.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!