stable-diffusion-3.5-large-turbo 是一種高精確度文字到影像模型。
本指南將解釋如何在 Google Colab 上設定和運行模型。
訪問擁抱臉。
要使用 stable-diffusion-3.5-large-turbo,您需要一個 Huggingface 帳號。
如果您還沒有帳戶,請建立帳戶。
註冊後,您將看到以下畫面:
輸入所需信息,您將立即獲得模型的存取權限。
如果您想下載並使用該模型,您將需要存取令牌。從您的帳戶頁面建立一個:
透過右上角的個人資料圖示導覽到您的帳戶頁面,前往存取令牌選項卡,然後選擇建立新令牌來建立令牌。
首先,在 Google Colab 中安裝必要的函式庫:
!pip install --quiet -U transformers
-U 選項將程式庫更新至最新版本,--quiet 禁止下載訊息。
透過執行以下命令並輸入您先前建立的令牌來驗證您的 Huggingface 帳戶:
!huggingface-cli login
使用以下 Python 程式碼載入並設定模型:
import torch from diffusers import StableDiffusion3Pipeline pipe = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3.5-large-turbo", torch_dtype=torch.bfloat16) pipe = pipe.to("cuda")
注意:此模型消耗約 27GB 記憶體。
透過執行此程式碼來產生影像來測試設定:
prompt = "A capybara holding a sign that reads Hello Fast World" save_filename = "capybara.png" image = pipe( prompt, num_inference_steps=4, guidance_scale=0.0, ).images[0]
您可以在 Diffusers GitHub 文件中找到這些參數的解釋。
儲存並顯示產生的影像:
image.save(save_filename) image
以上是如何在 Google Colab 上運行 stable-diffusion--large-turbo的詳細內容。更多資訊請關注PHP中文網其他相關文章!