cari
RumahPeranti teknologiAIImagen 3: Panduan dengan Contoh di API Gemini

imagen 3: tutorial python untuk generasi teks-ke-imej

Imagen 3 adalah model teks-ke-imej yang kuat yang mampu menghasilkan imej yang sangat terperinci dan bergaya, bahkan menggabungkan teks. Tutorial ini menunjukkan cara memanfaatkan keupayaan Imagen 3 secara pemrograman menggunakan AI dan Python generatif Google. Kami akan merangkumi persediaan persekitaran, pelaksanaan kod, dan meneroka pelbagai pilihan penjanaan imej.

Mengakses Imagen 3 melalui Google Generative AI API

Untuk memulakan, anda memerlukan projek Google Cloud dan kunci API.

Menyediakan persekitaran Google Cloud anda:

  1. Google Cloud Console: Akses konsol Google Cloud dan log masuk.
  2. Projek baru: Buat projek baru (mis., "Imagen-Tutorial").
  3. Butiran Projek: Isi butiran projek yang diperlukan. Bidang organisasi adalah pilihan.

Imagen 3: A Guide With Examples in the Gemini API

Generasi utama API:

    navigasi ke halaman utama API dalam studio Google AI.
  1. Klik "Buat Kunci API."
  2. Pilih projek yang baru dibuat dan klik "Buat."
  3. Simpan kunci API anda dengan selamat. Buat fail di direktori projek anda dengan kandungan berikut: .env
<code>GEMINI_API_KEY=<your_api_key></your_api_key></code>

Persediaan Akaun Pengebilan:

Imagen 3 adalah perkhidmatan berbayar. Mengaitkan akaun pengebilan dengan projek Google Cloud anda untuk mengelakkan kesilapan penggunaan API. Ikuti arahan di Google AI Studio untuk menghubungkan atau membuat akaun pengebilan. Kos semasa bagi setiap generasi imej ialah $ 0.03 (periksa halaman harga rasmi untuk kadar terkini).

Persediaan persekitaran python python (anaconda disyorkan): Imagen 3: A Guide With Examples in the Gemini API

Pasang Anaconda:

Muat turun dan pasang Anaconda dari laman web rasmi.
  1. Buat persekitaran:
  2. Aktifkan persekitaran: conda create -n imagen python=3.9
  3. Pasang pakej: conda activate imagen
  4. menjana imej dengan python: pip install -q -U google-genai pillow python-dotenv
Buat skrip python (mis., ) dalam direktori yang sama seperti fail

anda.

gen_image.py .env Pilihan Generasi Imej Lanjutan:

# Import necessary libraries
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import os
from dotenv import load_dotenv

# Load API key from .env
load_dotenv()
api_key = os.getenv("GEMINI_API_KEY")

# Initialize the client
client = genai.Client(api_key=api_key)

# Generate an image
prompt = """A dog surfing at the beach"""
response = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(number_of_images=1)
)

# Display the image
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

objek Imagen 3: A Guide With Examples in the Gemini API membolehkan penyesuaian:

  • number_of_images: Menjana pelbagai imej (lalai: 4).
  • aspect_ratio: mengawal nisbah aspek (mis., "9:16" untuk imej menegak).
  • safety_filter_level: Pada masa ini hanya menyokong BLOCK_LOW_AND_ABOVE.
  • person_generation: Kawal sama ada orang dibenarkan dalam imej (ALLOW_ADULT atau DONT_ALLOW).

Kejuruteraan Prompt Berkesan:

membuat arahan berkesan adalah penting. Gunakan bahasa deskriptif, tentukan gaya, dan pertimbangkan untuk menambah butiran mengenai pencahayaan, tetapan kamera, dan teknik artistik untuk hasil yang lebih baik. Rujuk dokumentasi rasmi Imagen 3 untuk garis panduan segera terperinci.

Pengeditan dan penyesuaian imej (akses terhad pada masa ini):

Imagen 3 menawarkan ciri penyuntingan dan penyesuaian imej, tetapi akses kini terhad.

Kesimpulan:

Tutorial ini menyediakan asas untuk menggunakan Imagen 3 melalui Google Generative AI API dan Python. Eksperimen dengan pilihan yang berbeza dan pilihan konfigurasi untuk membuka kunci potensi penuh model teks-ke-imej yang kuat ini. Ingatlah untuk sentiasa menyemak dokumentasi rasmi untuk maklumat dan harga yang paling terkini.

Atas ialah kandungan terperinci Imagen 3: Panduan dengan Contoh di API Gemini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Saya cuba pengekodan getaran dengan kursor AI dan ia menakjubkan!Saya cuba pengekodan getaran dengan kursor AI dan ia menakjubkan!Mar 20, 2025 pm 03:34 PM

Pengekodan Vibe membentuk semula dunia pembangunan perisian dengan membiarkan kami membuat aplikasi menggunakan bahasa semulajadi dan bukannya kod yang tidak berkesudahan. Diilhamkan oleh penglihatan seperti Andrej Karpathy, pendekatan inovatif ini membolehkan Dev

Cara Menggunakan Dall-E 3: Contoh, Contoh, dan CiriCara Menggunakan Dall-E 3: Contoh, Contoh, dan CiriMar 09, 2025 pm 01:00 PM

Dall-E 3: Alat Penciptaan Imej AI Generatif AI Generatif merevolusi penciptaan kandungan, dan Dall-E 3, model penjanaan imej terbaru OpenAI, berada di barisan hadapan. Dikeluarkan pada bulan Oktober 2023, ia dibina pada pendahulunya, Dall-E dan Dall-E 2

Top 5 Genai dilancarkan pada Februari 2025: GPT-4.5, Grok-3 & More!Top 5 Genai dilancarkan pada Februari 2025: GPT-4.5, Grok-3 & More!Mar 22, 2025 am 10:58 AM

Februari 2025 telah menjadi satu lagi bulan yang berubah-ubah untuk AI generatif, membawa kita beberapa peningkatan model yang paling dinanti-nantikan dan ciri-ciri baru yang hebat. Dari Xai's Grok 3 dan Anthropic's Claude 3.7 Sonnet, ke Openai's G

Bagaimana cara menggunakan Yolo V12 untuk pengesanan objek?Bagaimana cara menggunakan Yolo V12 untuk pengesanan objek?Mar 22, 2025 am 11:07 AM

Yolo (anda hanya melihat sekali) telah menjadi kerangka pengesanan objek masa nyata yang terkemuka, dengan setiap lelaran bertambah baik pada versi sebelumnya. Versi terbaru Yolo V12 memperkenalkan kemajuan yang meningkatkan ketepatan

Sora vs Veo 2: Mana yang mencipta video yang lebih realistik?Sora vs Veo 2: Mana yang mencipta video yang lebih realistik?Mar 10, 2025 pm 12:22 PM

Google's Veo 2 dan Openai's Sora: Generator Video AI Mana yang memerintah Supreme? Kedua -dua platform menghasilkan video AI yang mengagumkan, tetapi kekuatan mereka terletak di kawasan yang berbeza. Perbandingan ini, menggunakan pelbagai arahan, mendedahkan alat yang paling sesuai dengan keperluan anda. T

Google ' s Gencast: Peramalan Cuaca dengan Demo Mini GencastGoogle ' s Gencast: Peramalan Cuaca dengan Demo Mini GencastMar 16, 2025 pm 01:46 PM

Google Deepmind's Gencast: AI Revolusioner untuk Peramalan Cuaca Peramalan cuaca telah menjalani transformasi dramatik, bergerak dari pemerhatian asas kepada ramalan berkuasa AI yang canggih. Google Deepmind's Gencast, tanah air

Adakah chatgpt 4 o tersedia?Adakah chatgpt 4 o tersedia?Mar 28, 2025 pm 05:29 PM

CHATGPT 4 kini tersedia dan digunakan secara meluas, menunjukkan penambahbaikan yang ketara dalam memahami konteks dan menjana tindak balas yang koheren berbanding dengan pendahulunya seperti ChATGPT 3.5. Perkembangan masa depan mungkin merangkumi lebih banyak Inter yang diperibadikan

AI mana yang lebih baik daripada chatgpt?AI mana yang lebih baik daripada chatgpt?Mar 18, 2025 pm 06:05 PM

Artikel ini membincangkan model AI yang melampaui chatgpt, seperti Lamda, Llama, dan Grok, menonjolkan kelebihan mereka dalam ketepatan, pemahaman, dan kesan industri. (159 aksara)

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

Versi Mac WebStorm

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

MinGW - GNU Minimalis untuk Windows

MinGW - GNU Minimalis untuk Windows

Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.