>成像3:用於文本到圖像生成的Python教程
Imagen 3是一個強大的文本對圖像模型,能夠生成高度詳細和風格上不同的圖像,甚至包含文本。 本教程演示瞭如何使用Google的生成AI API和Python以編程方式利用Imagen 3的功能。 我們將介紹環境設置,代碼實現並探索各種圖像生成選項。>通過Google Generative AI API
訪問Imagen 3開始,您需要一個Google Cloud項目和一個API鍵。
> >設置您的Google雲環境:>
- Google Cloud Console:
- 訪問Google Cloud Console並登錄。 新項目:
- 創建一個新項目(例如,“ Imagen-Tutorial”)。 > > 項目詳細信息:
- 填寫必要的項目詳細信息。 組織字段是可選的。
>導航到Google AI Studio中的API鍵頁。
單擊“創建API鍵”。- 選擇您新創建的項目,然後單擊“創建”。 >
- >安全地保存API密鑰。 在項目目錄中創建a
- 文件,並帶有以下內容:
-
.env
>計費帳戶設置:
<code>GEMINI_API_KEY=<your_api_key></your_api_key></code>
python環境設置(推薦Anaconda):
>下載並從官方網站安裝Anaconda。
創建環境:- 激活環境:
-
conda create -n imagen python=3.9
>安裝軟件包: -
conda activate imagen
- >用python生成圖像:>
pip install -q -U google-genai pillow python-dotenv
>在與您的 file的目錄中創建一個Python腳本(例如,
gen_image.py
高級圖像生成選項:.env
>
# Import necessary libraries from google import genai from google.genai import types from PIL import Image from io import BytesIO import os from dotenv import load_dotenv # Load API key from .env load_dotenv() api_key = os.getenv("GEMINI_API_KEY") # Initialize the client client = genai.Client(api_key=api_key) # Generate an image prompt = """A dog surfing at the beach""" response = client.models.generate_images( model="imagen-3.0-generate-002", prompt=prompt, config=types.GenerateImagesConfig(number_of_images=1) ) # Display the image for generated_image in response.generated_images: image = Image.open(BytesIO(generated_image.image.image_bytes)) image.show()對象允許自定義:
-
number_of_images
:生成多個圖像(默認值:4)。 >
-
aspect_ratio
:控制縱橫比(例如,垂直圖像的“ 9:16”)。 - :當前僅支持
safety_filter_level
。BLOCK_LOW_AND_ABOVE
> - :控製圖像中是否允許人們(
person_generation
或ALLOW_ADULT
)。DONT_ALLOW
>製作有效提示至關重要。 使用描述性語言,指定樣式,並考慮添加有關照明,相機設置和藝術技術的詳細信息,以更好地結果。 有關詳細的及時指南,請參閱官方Imagen 3文檔。 >
圖像編輯和自定義(當前有限的訪問):
>
Imagen 3提供圖像編輯和自定義功能,但訪問當前受到限制。
本教程為通過Google Generative AI API和Python使用Imagen 3提供了基礎。 嘗試不同的提示和配置選項,以解鎖此功能強大的文本對圖像模型的全部潛力。請記住,請始終檢查官方文檔以獲取最新的信息和定價。
以上是成像3:帶有雙子座API示例的指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Vibe編碼通過讓我們使用自然語言而不是無盡的代碼行創建應用程序來重塑軟件開發的世界。受Andrej Karpathy等有遠見的人的啟發,這種創新的方法使Dev

DALL-E 3:生成的AI圖像創建工俱生成的AI正在革新內容創建,而OpenAI最新的圖像生成模型Dall-E 3處於最前沿。它於2023年10月發行,建立在其前任Dall-E和Dall-E 2上

2025年2月,Generative AI又是一個改變遊戲規則的月份,為我們帶來了一些最令人期待的模型升級和開創性的新功能。從Xai的Grok 3和Anthropic的Claude 3.7十四行詩到Openai的G

Yolo(您只看一次)一直是領先的實時對象檢測框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了進步,可顯著提高準確性

Google的VEO 2和Openai的Sora:哪個AI視頻發電機佔據了至尊? 這兩個平台都產生了令人印象深刻的AI視頻,但它們的優勢在於不同的領域。 使用各種提示,這種比較揭示了哪種工具最適合您的需求。 t

Google DeepMind的Gencast:天氣預報的革命性AI 天氣預報經歷了巨大的轉變,從基本觀察到復雜的AI驅動預測。 Google DeepMind的Gencast,開創性

本文討論了AI模型超過Chatgpt,例如Lamda,Llama和Grok,突出了它們在準確性,理解和行業影響方面的優勢。(159個字符)

Chatgpt 4當前可用並廣泛使用,與諸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和產生連貫的響應方面取得了重大改進。未來的發展可能包括更多個性化的間


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

Dreamweaver CS6
視覺化網頁開發工具

Dreamweaver Mac版
視覺化網頁開發工具

記事本++7.3.1
好用且免費的程式碼編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。