recherche
MaisonPériphériques technologiquesIAImagen 3: un guide avec des exemples dans l'API Gemini

Imagen 3: Un tutoriel Python pour la génération de texte à l'image

Imagen 3 est un puissant modèle de texte à image capable de générer des images très détaillées et stylistiquement diverses, même en incorporant du texte. Ce didacticiel montre comment tirer parti des capacités d'imagen 3 par programme en utilisant l'API AI et Python génératifs de Google. Nous couvrirons la configuration de l'environnement, la mise en œuvre du code et explorerons diverses options de génération d'images.

Accéder à Imagen 3 via l'API Generative AI Google

Pour commencer, vous aurez besoin d'un projet Google Cloud et d'une clé API.

Configuration de votre environnement Google Cloud:

  1. Console Cloud Google: Accédez à la console Google Cloud et connectez-vous.
  2. Nouveau projet: Créer un nouveau projet (par exemple, "Imagen-tutorial").
  3. Détails du projet: Remplissez les détails du projet nécessaires. Le champ d'organisation est facultatif.

Imagen 3: A Guide With Examples in the Gemini API

Génération de clés de l'API:

  1. Accédez à la page de la clé API dans Google AI Studio.
  2. Cliquez sur "Créer une clé API."
  3. Sélectionnez votre projet nouvellement créé et cliquez sur "Créer".
  4. Enregistrez votre clé API en toute sécurité. Créez un fichier .env dans votre répertoire de projet avec le contenu suivant:
<code>GEMINI_API_KEY=<your_api_key></your_api_key></code>

Configuration du compte de facturation:

Imagen 3 est un service payant. Associez un compte de facturation à votre projet Google Cloud pour éviter les erreurs d'utilisation de l'API. Suivez les invites dans Google AI Studio pour lier ou créer un compte de facturation. Le coût actuel par génération d'images est de 0,03 $ (vérifiez la page de tarification officielle des derniers tarifs).

Imagen 3: A Guide With Examples in the Gemini API

Configuration de l'environnement Python (Anaconda recommandé):

  1. Installez Anaconda: Téléchargez et installez Anaconda à partir du site officiel.
  2. Créer un environnement: conda create -n imagen python=3.9
  3. Activer l'environnement: conda activate imagen
  4. Installer les packages: pip install -q -U google-genai pillow python-dotenv

Génération d'images avec Python:

Créez un script Python (par exemple, gen_image.py) dans le même répertoire que votre fichier .env.

# Import necessary libraries
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import os
from dotenv import load_dotenv

# Load API key from .env
load_dotenv()
api_key = os.getenv("GEMINI_API_KEY")

# Initialize the client
client = genai.Client(api_key=api_key)

# Generate an image
prompt = """A dog surfing at the beach"""
response = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(number_of_images=1)
)

# Display the image
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

Imagen 3: A Guide With Examples in the Gemini API

Options de génération d'images avancées:

L'objet types.GenerateImagesConfig permet la personnalisation:

  • number_of_images: générer plusieurs images (par défaut: 4).
  • aspect_ratio: Contrôler le rapport d'aspect (par exemple, "9:16" pour les images verticales).
  • safety_filter_level: actuellement ne prend en charge que BLOCK_LOW_AND_ABOVE.
  • person_generation: Contrôlez si les gens sont autorisés à l'image (ALLOW_ADULT ou DONT_ALLOW).

Ingénierie rapide efficace:

Création des invites efficaces est cruciale. Utilisez un langage descriptif, spécifiez les styles et envisagez d'ajouter des détails sur l'éclairage, les paramètres de la caméra et les techniques artistiques pour de meilleurs résultats. Reportez-vous à la documentation officielle de l'imagen 3 pour des directives rapides détaillées.

Édition et personnalisation d'image (Accès actuellement limité):

Imagen 3 propose des fonctionnalités d'édition et de personnalisation d'image, mais l'accès est actuellement restreint.

Conclusion:

Ce didacticiel fournit une base pour l'utilisation d'Imagen 3 via l'API et Python Génératifs Google. Expérimentez avec différentes invites et options de configuration pour déverrouiller le plein potentiel de ce puissant modèle de texte à image. N'oubliez pas de toujours vérifier la documentation officielle pour les informations et les prix les plus à jour.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
La nouvelle compilation annuelle des meilleures techniques d'ingénierie rapideLa nouvelle compilation annuelle des meilleures techniques d'ingénierie rapideApr 10, 2025 am 11:22 AM

Pour ceux d'entre vous qui pourraient être nouveaux dans ma chronique, j'explore largement les dernières avancées de l'IA dans tous les domaines, y compris des sujets tels que l'IA incarnée, le raisonnement de l'IA, les percées de haute technologie dans l'IA, l'ingénierie rapide, la formation de l'IA, la mise en place de l'IA, l'IA re

Plan d'action du continent de l'IA en Europe: gigafactories, laboratoires de données et IA vertePlan d'action du continent de l'IA en Europe: gigafactories, laboratoires de données et IA verteApr 10, 2025 am 11:21 AM

Le plan d'action ambitieux de l'IA de l'IA d'Europe vise à établir l'UE en tant que leader mondial de l'intelligence artificielle. Un élément clé est la création d'un réseau de gigafactories d'IA, chacun abritant environ 100 000 puces AI avancées - quatre fois le capaci

L'histoire d'agent simple de Microsoft est-elle suffisante pour créer plus de fans?L'histoire d'agent simple de Microsoft est-elle suffisante pour créer plus de fans?Apr 10, 2025 am 11:20 AM

L'approche unifiée de Microsoft des applications d'agent d'IA: une victoire claire pour les entreprises L'annonce récente de Microsoft concernant les nouvelles capacités d'agent d'IA impressionné par sa présentation claire et unifiée. Contrairement à de nombreuses annonces technologiques enlisées dans TE

Vendre une stratégie d'IA aux employés: le manifeste du PDG de ShopifyVendre une stratégie d'IA aux employés: le manifeste du PDG de ShopifyApr 10, 2025 am 11:19 AM

La récente note du PDG de Shopify Tobi Lütke déclare hardiment la maîtrise de l'IA une attente fondamentale pour chaque employé, marquant un changement culturel important au sein de l'entreprise. Ce n'est pas une tendance éphémère; C'est un nouveau paradigme opérationnel intégré à P

IBM lance le mainframe Z17 avec une intégration complète de l'IAIBM lance le mainframe Z17 avec une intégration complète de l'IAApr 10, 2025 am 11:18 AM

MAINTRADE Z17 d'IBM: intégration de l'IA pour les opérations commerciales améliorées Le mois dernier, au siège de New York d'IBM, j'ai reçu un aperçu des capacités du Z17. S'appuyant sur le succès du Z16 (lancé en 2022 et démontrant une augmentation des revenus soutenus

5 Chatgpt invite à s'arrêter en fonction des autres et à vous faire confiance pleinement5 Chatgpt invite à s'arrêter en fonction des autres et à vous faire confiance pleinementApr 10, 2025 am 11:17 AM

Déverrouiller une confiance inébranlable et éliminer le besoin de validation externe! Ces cinq invites Chatgpt vous guideront vers une autonomie complète et un changement transformateur de la perception de soi. Copiez, collez simplement et personnalisez le crochet dans

L'IA est dangereusement similaire à votre espritL'IA est dangereusement similaire à votre espritApr 10, 2025 am 11:16 AM

Une récente [étude] d'Anthropic, une société de sécurité et de recherche sur l'intelligence artificielle, commence à révéler la vérité sur ces processus complexes, montrant une complexité qui est avec inquiétude à notre propre domaine cognitif. L'intelligence naturelle et l'intelligence artificielle peuvent être plus similaires que nous ne le pensons. Espection à l'intérieur: étude d'interprétabilité anthropique Les nouvelles découvertes de la recherche menée par anthropique représentent des progrès importants dans le domaine de l'interprétabilité mécaniste, qui vise à rétro-ingénieur l'informatique interne de l'IA - pas simplement d'observer ce que fait l'IA, mais comprend comment il le fait au niveau des neurones artificiels. Imaginez essayer de comprendre le cerveau en dessinant ce que les neurones tirent lorsque quelqu'un voit un objet spécifique ou pense à une idée spécifique. UN

Dragonwing met en valeur l'élan Edge de QualcommDragonwing met en valeur l'élan Edge de QualcommApr 10, 2025 am 11:14 AM

Dragonwing de Qualcomm: un bond stratégique dans l'entreprise et l'infrastructure Qualcomm étend agressivement sa portée au-delà du mobile, ciblant les marchés d'entreprise et d'infrastructure dans le monde avec sa nouvelle marque Dragonwing. Ce n'est pas simplement un rebran

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Listes Sec

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

Télécharger la version Mac de l'éditeur Atom

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser