與Dreambooth和Lora進行微調穩定的擴散XL-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

與Dreambooth和Lora進行微調穩定的擴散XL

尊渡假赌尊渡假赌尊渡假赌

Mar 09, 2025 am 09:55 AM

>本教程探索穩定的擴散XL（SDXL）和Dreambooth，演示瞭如何利用圖像生成和模型微調的diffusers庫。我們將使用個人照片微調SDXL並評估結果。鼓勵AI新移民從AI基礎課程開始。 >

理解穩定的擴散xl >

穩定性AI的SDXL 1.0代表了AI文本對圖像生成的顯著飛躍。在僅研究的SDXL 0.9的基礎上，它是最強大的公開圖像創建模型。與其他開源替代方案相比，廣泛的測試證實了其優越的圖像質量。

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 來自arxiv.org

> >的圖像 這種提高的質量源於兩個模型的合奏：35億個參數基礎發生器和66億個參數煉油廠。這種雙重方法優化了圖像質量，同時保持消費者GPU的效率。 SDXL 1.0簡化了圖像的生成，從簡明提示產生復雜的結果。自定義數據集還精簡，提供了對圖像結構，樣式和構圖的顆粒狀控制。

> Dreambooth：個性化圖像生成

Google的Dreambooth（2022）是生成AI的突破，特別是對於穩定擴散等文本到圖像模型。正如Google的研究人員所描述的那樣：“這就像一個照相亭，但以使其能夠在您的夢想帶到您的任何地方合成的方式捕獲主題。”

來自Dreambooth

>的圖像

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

> Dreambooth將自定義主題註入模型，為特定人員，對像或場景創建專門的發電機。培訓僅需要幾張（3-5）張圖像。然後，受過訓練的模型將主題置於不同的環境和擺姿勢，僅受想像中的限制。

> Dreambooth應用程序

> Dreambooth的可自定義圖像生成受益於各個領域：

創意產業：

圖形設計，廣告和娛樂活動從其獨特的視覺內容創建功能中受益。

在現實或純粹的虛構設置中創建難以復製或不可能的場景。
生成個性化的教育內容和艾滋病研究，需要視覺代表。
> 可以通過擁抱的面部空間演示訪問SDXL（從提示符生成四個圖像）或python庫，用於自定義提示圖。
>設置和圖像生成diffusers
>
確保可用的GPU可用：
```
!nvidia-smi
```
> install
：diffusers
```
%pip install --upgrade diffusers[torch] -q
```
>加載模型（使用FP16用於GPU存儲器效率）：
>

生成圖像：
```
from diffusers import DiffusionPipeline, AutoencoderKL
import torch

vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
pipe.to("cuda");
```
>使用輔助功能顯示圖像（在原始功能中提供）：
>
```
prompt = "A man in a spacesuit is running a marathon in the jungle."
image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)
```
```
# ... (image_grid function from original code) ...
image_grid(image.images, 2, 2)
```
改善煉油廠的結果

以提高質量，使用SDXL煉油廠：
```
# ... (refiner loading and processing code from original) ...
```
> autotrain Advanced
微調SDXL Autotrain Advanced簡化了SDXL微調。使用：
安裝它（注意：原始教程使用現已過時的Colab筆記本作為替代方法；這是為了簡潔而省略的。）

Dreambooth微調（刪節）
```
%pip install -U autotrain-advanced
```
然後，該教程在圖像的個人數據集上使用Autotrain Advance的Dreambooth腳本進行了微調SDXL的詳細示例。本節涉及設置變量，創建Kaggle數據集並運行自動輔助腳本。輸出顯示了訓練過程以及由此產生的洛拉（Lora）舉重上傳到擁抱的臉。然後演示使用微調模型的推斷，在各種情況下展示了指定主題的生成圖像。最後，探索了煉油廠與微調模型的使用。由於長度的限制，此詳細的部分在此處顯著凝結。請參閱原始代碼和解釋。

結論

本教程提供了SDXL和Dreambooth的全面概述，展示了它們的功能，並易於使用>

以上是與Dreambooth和Lora進行微調穩定的擴散XL的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

7強大的AI提示每個項目經理現在需要掌握May 08, 2025 am 11:39 AM

聊天機器人像Chatgpt這樣的聊天機器人舉例說明了生成的AI，為項目經理提供了功能強大的工具來簡化工作流程並確保項目按計劃和預算範圍內保持。但是，在製作正確的提示時有效使用鉸鏈。精確，細節

通過AI本身的有益協助，定義難以捉摸的AGI的含義不明的含義May 08, 2025 am 11:37 AM

定義人工智能（AGI）的挑戰是重大的。 AGI進步的主張通常缺乏明確的基準，其定義是針對預定的研究方向而定制的。本文探討了一種新穎的定義方法

IBM認為2025展示watsonx.data在生成AI中的作用May 08, 2025 am 11:32 AM

IBM WATSONX.DATA：簡化企業AI數據堆棧 IBM將WATSONX.DATA定位為企業的關鍵平台，旨在加速精確而可擴展的生成AI解決方案。這是通過簡化投訴來實現的

人形機器人機器的崛起即將到來。May 08, 2025 am 11:29 AM

在AI和材料科學領域的突破所推動的機器人技術的快速進步已準備好迎來人類機器人的新時代。多年來，工業自動化一直是主要重點，但是機器人的功能迅速exp

Netflix重新修改界面 - 首次亮相AI搜索工具和類似Tiktok的設計May 08, 2025 am 11:25 AM

Netflix 界面十年來最大更新：更智能、更個性化，擁抱多元內容 Netflix 週三宣布對其用戶界面進行十年來最大規模的改版，不僅外觀煥然一新，還增加了更多關於每個節目的信息，並引入了更智能的 AI 搜索工具，能夠理解模糊的概念（例如“氛圍”），以及更靈活的結構，以便更好地展示公司在新興的視頻遊戲、直播活動、體育賽事和其他新型內容方面的興趣。為了緊跟潮流，新的移動端豎屏視頻組件將使粉絲更容易滾動瀏覽預告片和片段，觀看完整節目或與他人分享內容。這讓人聯想起無限滾動且非常成功的短視頻網站 Ti

在AGI之前很久：三個AI里程碑會挑戰您May 08, 2025 am 11:24 AM

人工智能通用智能（AGI）的討論日益增多，促使許多人思考當人工智能超越人類智能時會發生什麼。這個時刻是近在咫尺還是遙遙無期，取決於你問誰，但我認為這並非我們應該關注的最重要的里程碑。哪些更早的人工智能里程碑會影響到每個人？哪些里程碑已經實現？以下是我認為已經發生的三件事。人工智能超越人類弱點在2022年的電影《社交困境》中，人文科技中心（Center for Humane Technology）的崔斯坦·哈里斯指出，人工智能已經超越了人類的弱點。這是什麼意思？這意味著人工智能已經能夠運用人類