Imagen 3: Un tutoriel Python pour la génération de texte à l'image
Imagen 3 est un puissant modèle de texte à image capable de générer des images très détaillées et stylistiquement diverses, même en incorporant du texte. Ce didacticiel montre comment tirer parti des capacités d'imagen 3 par programme en utilisant l'API AI et Python génératifs de Google. Nous couvrirons la configuration de l'environnement, la mise en œuvre du code et explorerons diverses options de génération d'images.
Accéder à Imagen 3 via l'API Generative AI Google
Pour commencer, vous aurez besoin d'un projet Google Cloud et d'une clé API.
Configuration de votre environnement Google Cloud:
- Console Cloud Google: Accédez à la console Google Cloud et connectez-vous.
- Nouveau projet: Créer un nouveau projet (par exemple, "Imagen-tutorial").
- Détails du projet: Remplissez les détails du projet nécessaires. Le champ d'organisation est facultatif.
Génération de clés de l'API:
- Accédez à la page de la clé API dans Google AI Studio.
- Cliquez sur "Créer une clé API."
- Sélectionnez votre projet nouvellement créé et cliquez sur "Créer".
- Enregistrez votre clé API en toute sécurité. Créez un fichier
.env
dans votre répertoire de projet avec le contenu suivant:
<code>GEMINI_API_KEY=<your_api_key></your_api_key></code>
Configuration du compte de facturation:
Imagen 3 est un service payant. Associez un compte de facturation à votre projet Google Cloud pour éviter les erreurs d'utilisation de l'API. Suivez les invites dans Google AI Studio pour lier ou créer un compte de facturation. Le coût actuel par génération d'images est de 0,03 $ (vérifiez la page de tarification officielle des derniers tarifs).
Configuration de l'environnement Python (Anaconda recommandé):
- Installez Anaconda: Téléchargez et installez Anaconda à partir du site officiel.
- Créer un environnement:
conda create -n imagen python=3.9
- Activer l'environnement:
conda activate imagen
- Installer les packages:
pip install -q -U google-genai pillow python-dotenv
Génération d'images avec Python:
Créez un script Python (par exemple, gen_image.py
) dans le même répertoire que votre fichier .env
.
# Import necessary libraries from google import genai from google.genai import types from PIL import Image from io import BytesIO import os from dotenv import load_dotenv # Load API key from .env load_dotenv() api_key = os.getenv("GEMINI_API_KEY") # Initialize the client client = genai.Client(api_key=api_key) # Generate an image prompt = """A dog surfing at the beach""" response = client.models.generate_images( model="imagen-3.0-generate-002", prompt=prompt, config=types.GenerateImagesConfig(number_of_images=1) ) # Display the image for generated_image in response.generated_images: image = Image.open(BytesIO(generated_image.image.image_bytes)) image.show()
Options de génération d'images avancées:
L'objet types.GenerateImagesConfig
permet la personnalisation:
-
number_of_images
: générer plusieurs images (par défaut: 4). -
aspect_ratio
: Contrôler le rapport d'aspect (par exemple, "9:16" pour les images verticales). -
safety_filter_level
: actuellement ne prend en charge queBLOCK_LOW_AND_ABOVE
. -
person_generation
: Contrôlez si les gens sont autorisés à l'image (ALLOW_ADULT
ouDONT_ALLOW
).
Ingénierie rapide efficace:
Création des invites efficaces est cruciale. Utilisez un langage descriptif, spécifiez les styles et envisagez d'ajouter des détails sur l'éclairage, les paramètres de la caméra et les techniques artistiques pour de meilleurs résultats. Reportez-vous à la documentation officielle de l'imagen 3 pour des directives rapides détaillées.
Édition et personnalisation d'image (Accès actuellement limité):
Imagen 3 propose des fonctionnalités d'édition et de personnalisation d'image, mais l'accès est actuellement restreint.
Conclusion:
Ce didacticiel fournit une base pour l'utilisation d'Imagen 3 via l'API et Python Génératifs Google. Expérimentez avec différentes invites et options de configuration pour déverrouiller le plein potentiel de ce puissant modèle de texte à image. N'oubliez pas de toujours vérifier la documentation officielle pour les informations et les prix les plus à jour.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Pour ceux d'entre vous qui pourraient être nouveaux dans ma chronique, j'explore largement les dernières avancées de l'IA dans tous les domaines, y compris des sujets tels que l'IA incarnée, le raisonnement de l'IA, les percées de haute technologie dans l'IA, l'ingénierie rapide, la formation de l'IA, la mise en place de l'IA, l'IA re

Le plan d'action ambitieux de l'IA de l'IA d'Europe vise à établir l'UE en tant que leader mondial de l'intelligence artificielle. Un élément clé est la création d'un réseau de gigafactories d'IA, chacun abritant environ 100 000 puces AI avancées - quatre fois le capaci

L'approche unifiée de Microsoft des applications d'agent d'IA: une victoire claire pour les entreprises L'annonce récente de Microsoft concernant les nouvelles capacités d'agent d'IA impressionné par sa présentation claire et unifiée. Contrairement à de nombreuses annonces technologiques enlisées dans TE

La récente note du PDG de Shopify Tobi Lütke déclare hardiment la maîtrise de l'IA une attente fondamentale pour chaque employé, marquant un changement culturel important au sein de l'entreprise. Ce n'est pas une tendance éphémère; C'est un nouveau paradigme opérationnel intégré à P

MAINTRADE Z17 d'IBM: intégration de l'IA pour les opérations commerciales améliorées Le mois dernier, au siège de New York d'IBM, j'ai reçu un aperçu des capacités du Z17. S'appuyant sur le succès du Z16 (lancé en 2022 et démontrant une augmentation des revenus soutenus

Déverrouiller une confiance inébranlable et éliminer le besoin de validation externe! Ces cinq invites Chatgpt vous guideront vers une autonomie complète et un changement transformateur de la perception de soi. Copiez, collez simplement et personnalisez le crochet dans

Une récente [étude] d'Anthropic, une société de sécurité et de recherche sur l'intelligence artificielle, commence à révéler la vérité sur ces processus complexes, montrant une complexité qui est avec inquiétude à notre propre domaine cognitif. L'intelligence naturelle et l'intelligence artificielle peuvent être plus similaires que nous ne le pensons. Espection à l'intérieur: étude d'interprétabilité anthropique Les nouvelles découvertes de la recherche menée par anthropique représentent des progrès importants dans le domaine de l'interprétabilité mécaniste, qui vise à rétro-ingénieur l'informatique interne de l'IA - pas simplement d'observer ce que fait l'IA, mais comprend comment il le fait au niveau des neurones artificiels. Imaginez essayer de comprendre le cerveau en dessinant ce que les neurones tirent lorsque quelqu'un voit un objet spécifique ou pense à une idée spécifique. UN

Dragonwing de Qualcomm: un bond stratégique dans l'entreprise et l'infrastructure Qualcomm étend agressivement sa portée au-delà du mobile, ciblant les marchés d'entreprise et d'infrastructure dans le monde avec sa nouvelle marque Dragonwing. Ce n'est pas simplement un rebran


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Listes Sec
SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

Dreamweaver CS6
Outils de développement Web visuel

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

SublimeText3 version chinoise
Version chinoise, très simple à utiliser