与Dreambooth和Lora进行微调稳定的扩散XL-人工智能-PHP中文网

首页

科技周边

人工智能

与Dreambooth和Lora进行微调稳定的扩散XL

尊渡假赌尊渡假赌尊渡假赌

Mar 09, 2025 am 09:55 AM

>本教程探索稳定的扩散XL（SDXL）和Dreambooth，演示了如何利用图像生成和模型微调的diffusers库。我们将使用个人照片微调SDXL并评估结果。鼓励AI新移民从AI基础课程开始。>

理解稳定的扩散xl >

稳定性AI的SDXL 1.0代表了AI文本对图像生成的显着飞跃。在仅研究的SDXL 0.9的基础上，它是最强大的公开图像创建模型。与其他开源替代方案相比，广泛的测试证实了其优越的图像质量。

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 来自arxiv.org

> >的图像 这种提高的质量源于两个模型的合奏：35亿个参数基础发生器和66亿个参数炼油厂。这种双重方法优化了图像质量，同时保持消费者GPU的效率。 SDXL 1.0简化了图像的生成，从简明提示产生复杂的结果。自定义数据集还精简，提供了对图像结构，样式和构图的颗粒状控制。

> Dreambooth：个性化图像生成

Google的Dreambooth（2022）是生成AI的突破，特别是对于稳定扩散等文本到图像模型。正如Google的研究人员所描述的那样：“这就像一个照相亭，但以使其能够在您的梦想带到您的任何地方合成的方式捕获主题。”

来自Dreambooth

>的图像

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

> Dreambooth将自定义主题注入模型，为特定人员，对象或场景创建专门的发电机。培训仅需要几张（3-5）张图像。然后，受过训练的模型将主题置于不同的环境和摆姿势，仅受想象中的限制。

> Dreambooth应用程序

> Dreambooth的可自定义图像生成受益于各个领域：

创意产业：

图形设计，广告和娱乐活动从其独特的视觉内容创建功能中受益。

在现实或纯粹的虚构设置中创建难以复制或不可能的场景。
生成个性化的教育内容和艾滋病研究，需要视觉代表。
> 可以通过拥抱的面部空间演示访问SDXL（从提示符生成四个图像）或python库，用于自定义提示图。
>设置和图像生成diffusers
>
确保可用的GPU可用：
```
!nvidia-smi
```
> install
：diffusers
```
%pip install --upgrade diffusers[torch] -q
```
>加载模型（使用FP16用于GPU存储器效率）：
>

生成图像：
```
from diffusers import DiffusionPipeline, AutoencoderKL
import torch

vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
pipe.to("cuda");
```
>使用辅助功能显示图像（在原始功能中提供）：
>
```
prompt = "A man in a spacesuit is running a marathon in the jungle."
image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)
```
```
# ... (image_grid function from original code) ...
image_grid(image.images, 2, 2)
```
改善炼油厂的结果

以提高质量，使用SDXL炼油厂：
```
# ... (refiner loading and processing code from original) ...
```
> autotrain Advanced
微调SDXL Autotrain Advanced简化了SDXL微调。使用：
安装它（注意：原始教程使用现已过时的Colab笔记本作为替代方法；这是为了简洁而省略的。）

Dreambooth微调（删节）
```
%pip install -U autotrain-advanced
```
然后，该教程在图像的个人数据集上使用Autotrain Advance的Dreambooth脚本进行了微调SDXL的详细示例。本节涉及设置变量，创建Kaggle数据集并运行自动辅助脚本。输出显示了训练过程以及由此产生的洛拉（Lora）举重上传到拥抱的脸。然后演示使用微调模型的推断，在各种情况下展示了指定主题的生成图像。最后，探索了炼油厂与微调模型的使用。由于长度的限制，此详细的部分在此处显着凝结。请参阅原始代码和解释。

结论

本教程提供了SDXL和Dreambooth的全面概述，展示了它们的功能，并易于使用>

以上是与Dreambooth和Lora进行微调稳定的扩散XL的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

7强大的AI提示每个项目经理现在需要掌握May 08, 2025 am 11:39 AM

聊天机器人诸如Chatgpt之类的聊天机器人举例说明了生成的AI，为项目经理提供了功能强大的工具来简化工作流程并确保项目按计划和预算范围内保持。但是，在制作正确的提示时有效使用铰链。精确，细节

通过AI本身的有益协助，定义难以捉摸的AGI的含义不明的含义May 08, 2025 am 11:37 AM

定义人工智能（AGI）的挑战是重大的。 AGI进步的主张通常缺乏明确的基准，其定义是针对预定的研究方向而定制的。本文探讨了一种新颖的定义方法

IBM认为2025展示watsonx.data在生成AI中的作用May 08, 2025 am 11:32 AM

IBM WATSONX.DATA：简化企业AI数据堆栈 IBM将watsonx.data定位为企业的关键平台，旨在加速精确且可扩展的生成AI解决方案。这是通过简化投诉来实现的

人形机器人机器的崛起即将到来。May 08, 2025 am 11:29 AM

在AI和材料科学领域的突破所推动的机器人技术的快速进步已准备好迎来人类机器人的新时代。多年来，工业自动化一直是主要重点，但是机器人的功能迅速exp

Netflix重新修改界面 - 首次亮相AI搜索工具和类似Tiktok的设计May 08, 2025 am 11:25 AM

Netflix 界面十年来最大更新：更智能、更个性化，拥抱多元内容 Netflix 周三宣布对其用户界面进行十年来最大规模的改版，不仅外观焕然一新，还增加了更多关于每个节目的信息，并引入了更智能的 AI 搜索工具，能够理解模糊的概念（例如“氛围”），以及更灵活的结构，以便更好地展示公司在新兴的视频游戏、直播活动、体育赛事和其他新型内容方面的兴趣。为了紧跟潮流，新的移动端竖屏视频组件将使粉丝更容易滚动浏览预告片和片段，观看完整节目或与他人分享内容。这让人联想起无限滚动且非常成功的短视频网站 Ti

在AGI之前很久：三个AI里程碑会挑战您May 08, 2025 am 11:24 AM

人工智能通用智能（AGI）的讨论日益增多，促使许多人思考当人工智能超越人类智能时会发生什么。这个时刻是近在咫尺还是遥遥无期，取决于你问谁，但我认为这并非我们应该关注的最重要的里程碑。哪些更早的人工智能里程碑会影响到每个人？哪些里程碑已经实现？以下是我认为已经发生的三件事。人工智能超越人类弱点在2022年的电影《社交困境》中，人文科技中心（Center for Humane Technology）的崔斯坦·哈里斯指出，人工智能已经超越了人类的弱点。这是什么意思？这意味着人工智能已经能够运用人类