即使在家里,Stable Diffusion XL Turbo(SDXL Turbo)也可以以惊人的速度创建详细的图像。
周二,Stability AI公司发布了一款名为“稳定扩散XL Turbo”的人工智能图像合成模型。该模型能够根据书面提示迅速生成图像。实际上,该模型的速度非常快,以至于该公司将其宣传为“实时”图像生成器,因为它还能够迅速转换来自网络摄像头等来源的图像
SDXL Turbo的主要创新在于它能够在一个步骤中产生图像输出,比其前身所需的20-50个步骤显着减少。Stability AI将这种效率的飞跃归功于一种被称为对抗性扩散蒸馏(ADD)的技术。ADD使用分数提取,其中模型从现有的图像合成模型中学习,以及对抗性损失,这增强了模型区分真实图像和生成图像的能力,提高了输出的真实性。
在周二发表的一篇专注于ADD技术的研究论文中,Stability AI详细介绍了该模型的内部工作原理。SDXL Turbo的优点之一是它与生成对抗网络(GAN)相似,特别是在产生单步图像输出方面。
SDXL Turbo的图像并不像SDXL在更高分辨率下生成的图像那样详细,因此它并不能完全替代之前的型号。然而,它以其惊人的速度节省了时间
为了进行尝试,我们使用 Automatic111 在Nvidia RTX 3060上本地运行SDXL Turbo(权重与SDXL权重一样下降),它可以在大约4秒内生成3步1024×1024图像,而具有类似细节的20步SDXL图像则需要26.4秒。较小的图像生成速度要快得多(对于512×768而言,不到1秒),当然,更强大的显卡,如RTX 3090或4090,也将允许更快的生成时间。与Stability的营销相反,我们发现SDXL Turbo图像在每张图像大约3-5步处具有最佳细节。
SDXL Turbo的生成速度就是所谓的“实时”。Stability AI表示,在NVIDIA A100(一款强大的AI调整图形处理器)上,该模型可以在207ms内生成一张512×512图像,包括编码、单个去噪步骤和解码。如果能够解决一致性问题,这样的速度可能会导致实时生成AI视频过滤器或实验性视频游戏图像生成。在这种情况下,一致性意味着在多个帧或代之间保持相同的主题。
目前,SDXL Turbo是在非商业研究许可证下提供的,限制其用于个人非商业目的。这一举措已经在Stable Diffusion社区受到了一些批评,但Stability AI表示对商业应用持开放态度,并邀请感兴趣的各方联系以获取更多信息。
与此同时,Stability AI面临着内部管理问题,一位投资者最近敦促首席执行官埃马德·莫斯塔克(Emad Mostaque)辞职。据报道,Stability AI管理层一直在探索将公司出售给更大实体的可能性,但这并没有影响Stability AI发布新产品的速度。就在上周,该公司推出了一款名为“稳定视频扩散”(Stable Video Diffusion)的软件,可以将静止图像转换成短视频剪辑
Stability AI在其图像编辑平台Clipdrop上提供了SDXL Turbo功能的测试版演示。你也可以在 Hugging Face 上免费试用一个非官方的现场演示。显然,所有常见的警告都适用,包括缺乏训练数据的来源和滥用的可能性。即使有这些悬而未决的问题,人工智能图像合成的技术进步肯定不会放缓。
如果你的朋友们喜欢的话,请关注一下“知新了了”!
以上是Stable Diffusion XL Turbo可以以'实时”的速度生成AI图像的详细内容。更多信息请关注PHP中文网其他相关文章!

Apollo Research的一份新报告显示,先进的AI系统的不受检查的内部部署构成了重大风险。 在大型人工智能公司中缺乏监督,普遍存在,允许潜在的灾难性结果

传统测谎仪已经过时了。依靠腕带连接的指针,打印出受试者生命体征和身体反应的测谎仪,在识破谎言方面并不精确。这就是为什么测谎结果通常不被法庭采纳的原因,尽管它曾导致许多无辜者入狱。 相比之下,人工智能是一个强大的数据引擎,其工作原理是全方位观察。这意味着科学家可以通过多种途径将人工智能应用于寻求真相的应用中。 一种方法是像测谎仪一样分析被审问者的生命体征反应,但采用更详细、更精确的比较分析。 另一种方法是利用语言标记来分析人们实际所说的话,并运用逻辑和推理。 俗话说,一个谎言会滋生另一个谎言,最终

航空航天业是创新的先驱,它利用AI应对其最复杂的挑战。 现代航空的越来越复杂性需要AI的自动化和实时智能功能,以提高安全性,降低操作

机器人技术的飞速发展为我们带来了一个引人入胜的案例研究。 来自Noetix的N2机器人重达40多磅,身高3英尺,据说可以后空翻。Unitree公司推出的G1机器人重量约为N2的两倍,身高约4英尺。比赛中还有许多体型更小的类人机器人参赛,甚至还有一款由风扇驱动前进的机器人。 数据解读 这场半程马拉松吸引了超过12,000名观众,但只有21台类人机器人参赛。尽管政府指出参赛机器人赛前进行了“强化训练”,但并非所有机器人均完成了全程比赛。 冠军——由北京类人机器人创新中心研发的Tiangong Ult

人工智能以目前的形式并不是真正智能的。它擅长模仿和完善现有数据。 我们不是在创造人工智能,而是人工推断 - 处理信息的机器,而人类则

一份报告发现,在谷歌相册Android版7.26版本的代码中隐藏了一个更新的界面,每次查看照片时,都会在屏幕底部显示一行新检测到的面孔缩略图。 新的面部缩略图缺少姓名标签,所以我怀疑您需要单独点击它们才能查看有关每个检测到的人员的更多信息。就目前而言,此功能除了谷歌相册已在您的图像中找到这些人之外,不提供任何其他信息。 此功能尚未上线,因此我们不知道谷歌将如何准确地使用它。谷歌可以使用缩略图来加快查找所选人员的更多照片的速度,或者可能用于其他目的,例如选择要编辑的个人。我们拭目以待。 就目前而言

增强者通过教授模型根据人类反馈进行调整来震撼AI的开发。它将监督的学习基金会与基于奖励的更新融合在一起,使其更安全,更准确,真正地帮助

科学家已经广泛研究了人类和更简单的神经网络(如秀丽隐杆线虫中的神经网络),以了解其功能。 但是,出现了一个关键问题:我们如何使自己的神经网络与新颖的AI一起有效地工作


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Dreamweaver Mac版
视觉化网页开发工具

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3 Linux新版
SublimeText3 Linux最新版

Atom编辑器mac版下载
最流行的的开源编辑器

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具