搜索
首页科技周边人工智能与Dreambooth和Lora进行微调稳定的扩散XL

>本教程探索稳定的扩散XL(SDXL)和Dreambooth,演示了如何利用图像生成和模型微调的diffusers库。 我们将使用个人照片微调SDXL并评估结果。 鼓励AI新移民从AI基础课程开始。>

理解稳定的扩散xl >

稳定性AI的SDXL 1.0代表了AI文本对图像生成的显着飞跃。 在仅研究的SDXL 0.9的基础上,它是最强大的公开图像创建模型。 与其他开源替代方案相比,广泛的测试证实了其优越的图像质量。

>

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 来自arxiv.org

> >的图像 这种提高的质量源于两个模型的合奏:35亿个参数基础发生器和66亿个参数炼油厂。这种双重方法优化了图像质量,同时保持消费者GPU的效率。 SDXL 1.0简化了图像的生成,从简明提示产生复杂的结果。 自定义数据集还精简,提供了对图像结构,样式和构图的颗粒状控制。

> Dreambooth:个性化图像生成

Google的Dreambooth(2022)是生成AI的突破,特别是对于稳定扩散等文本到图像模型。 正如Google的研究人员所描述的那样:“这就像一个照相亭,但以使其能够在您的梦想带到您的任何地方合成的方式捕获主题。”

来自Dreambooth

>的图像

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

> Dreambooth将自定义主题注入模型,为特定人员,对象或场景创建专门的发电机。 培训仅需要几张(3-5)张图像。 然后,受过训练的模型将主题置于不同的环境和摆姿势,仅受想象中的限制。

> Dreambooth应用程序

> Dreambooth的可自定义图像生成受益于各个领域:

创意产业:

图形设计,广告和娱乐活动从其独特的视觉内容创建功能中受益。

    个性化:
  1. 在现实或纯粹的虚构设置中创建难以复制或不可能的场景。
  2. 教育与研究:
  3. 生成个性化的教育内容和艾滋病研究,需要视觉代表。
  4. 访问稳定的扩散xl
  5. > 可以通过拥抱的面部空间演示访问SDXL(从提示符生成四个图像)或python库,用于自定义提示图。

    >设置和图像生成diffusers

    >

    确保可用的GPU可用:

    !nvidia-smi

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    > install

    diffusers

    %pip install --upgrade diffusers[torch] -q
    >加载模型(使用FP16用于GPU存储器效率):>

    生成图像:
    from diffusers import DiffusionPipeline, AutoencoderKL
    import torch
    
    vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
    pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
    pipe.to("cuda");

    >使用辅助功能显示图像(在原始功能中提供):>
    prompt = "A man in a spacesuit is running a marathon in the jungle."
    image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)

    # ... (image_grid function from original code) ...
    image_grid(image.images, 2, 2)

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 改善炼油厂的结果

    以提高质量,使用SDXL炼油厂:

    # ... (refiner loading and processing code from original) ...

    > autotrain Advanced Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    微调SDXL Autotrain Advanced简化了SDXL微调。 使用:

    安装它 (注意:原始教程使用现已过时的Colab笔记本作为替代方法;这是为了简洁而省略的。)

    Dreambooth微调(删节)
    %pip install -U autotrain-advanced

    然后,该教程在图像的个人数据集上使用Autotrain Advance的Dreambooth脚本进行了微调SDXL的详细示例。本节涉及设置变量,创建Kaggle数据集并运行自动辅助脚本。 输出显示了训练过程以及由此产生的洛拉(Lora)举重上传到拥抱的脸。 然后演示使用微调模型的推断,在各种情况下展示了指定主题的生成图像。 最后,探索了炼油厂与微调模型的使用。 由于长度的限制,此详细的部分在此处显着凝结。 请参阅原始代码和解释。

    结论

    本教程提供了SDXL和Dreambooth的全面概述,展示了它们的功能,并易于使用>

以上是与Dreambooth和Lora进行微调稳定的扩散XL的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
7强大的AI提示每个项目经理现在需要掌握7强大的AI提示每个项目经理现在需要掌握May 08, 2025 am 11:39 AM

聊天机器人诸如Chatgpt之类的聊天机器人举例说明了生成的AI,为项目经理提供了功能强大的工具来简化工作流程并确保项目按计划和预算范围内保持。 但是,在制作正确的提示时有效使用铰链。 精确,细节

通过AI本身的有益协助,定义难以捉摸的AGI的含义不明的含义通过AI本身的有益协助,定义难以捉摸的AGI的含义不明的含义May 08, 2025 am 11:37 AM

定义人工智能(AGI)的挑战是重大的。 AGI进步的主张通常缺乏明确的基准,其定义是针对预定的研究方向而定制的。本文探讨了一种新颖的定义方法

IBM认为2025展示watsonx.data在生成AI中的作用IBM认为2025展示watsonx.data在生成AI中的作用May 08, 2025 am 11:32 AM

IBM WATSONX.DATA:简化企业AI数据堆栈 IBM将watsonx.data定位为企业的关键平台,旨在加速精确且可扩展的生成AI解决方案。 这是通过简化投诉来实现的

人形机器人机器的崛起即将到来。人形机器人机器的崛起即将到来。May 08, 2025 am 11:29 AM

在AI和材料科学领域的突破所推动的机器人技术的快速进步已准备好迎来人类机器人的新时代。 多年来,工业自动化一直是主要重点,但是机器人的功能迅速exp

Netflix重新修改界面 - 首次亮相AI搜索工具和类似Tiktok的设计Netflix重新修改界面 - 首次亮相AI搜索工具和类似Tiktok的设计May 08, 2025 am 11:25 AM

Netflix 界面十年来最大更新:更智能、更个性化,拥抱多元内容 Netflix 周三宣布对其用户界面进行十年来最大规模的改版,不仅外观焕然一新,还增加了更多关于每个节目的信息,并引入了更智能的 AI 搜索工具,能够理解模糊的概念(例如“氛围”),以及更灵活的结构,以便更好地展示公司在新兴的视频游戏、直播活动、体育赛事和其他新型内容方面的兴趣。 为了紧跟潮流,新的移动端竖屏视频组件将使粉丝更容易滚动浏览预告片和片段,观看完整节目或与他人分享内容。这让人联想起无限滚动且非常成功的短视频网站 Ti

在AGI之前很久:三个AI里程碑会挑战您在AGI之前很久:三个AI里程碑会挑战您May 08, 2025 am 11:24 AM

人工智能通用智能(AGI)的讨论日益增多,促使许多人思考当人工智能超越人类智能时会发生什么。这个时刻是近在咫尺还是遥遥无期,取决于你问谁,但我认为这并非我们应该关注的最重要的里程碑。哪些更早的人工智能里程碑会影响到每个人?哪些里程碑已经实现?以下是我认为已经发生的三件事。 人工智能超越人类弱点 在2022年的电影《社交困境》中,人文科技中心(Center for Humane Technology)的崔斯坦·哈里斯指出,人工智能已经超越了人类的弱点。这是什么意思?这意味着人工智能已经能够运用人类

Venkat Achanta在Transunion的平台转型和AI野心Venkat Achanta在Transunion的平台转型和AI野心May 08, 2025 am 11:23 AM

Transunion的首席技术官Ranganath Achanta在2021年末加入公司后加入公司以来,率先进行了重大的技术转变。

当对AI的信任跃升时,生产力会随之而来当对AI的信任跃升时,生产力会随之而来May 08, 2025 am 11:11 AM

建立信任至关重要,对于成功采用业务的AI是至关重要的。 考虑到业务流程中的人类因素,这尤其如此。 像其他任何人一样,员工对AI及其实施引起了人们的关注。 德勤研究人员是SC

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境