搜索
首页科技周边人工智能MIT和Google联合研究StableRep新技术:利用合成图像训练AI图像模型

重点强调:

研究人员提出了一项名为StableRep的新技术,该技术利用由人工智能生成的图像来训练高度详细的人工智能图像模型

StableRep通过使用数百万标记的合成图像进行训练,采用“多正对比学习方法”来提高学习过程,并将其应用于开源文本到图像模型Stable Diffusion

- ⚙️ 尽管StableRep在ImageNet分类上取得了显著成就,但其生成图像的速度较慢,同时在文本提示和生成图像之间存在语义不匹配的问题。

站长之家(ChinaZ.com) 11月28日消息:MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型Stable Diffusion,取得了一系列显着的成就。

StableRep使用了一种称为“多正对比学习方法”的独特方式。在这种方法中,多个源自同一文本提示的图像被视为彼此的正对比,以增强学习过程。例如,针对风景文本提示,模型会将生成的多个风景图像与所有相关描述进行比较,以找出基于这些图像的微小差异,并将其应用于最终输出,从而创造出高度详细的图像

MIT和Google联合研究StableRep新技术:利用合成图像训练AI图像模型

研究人员指出,他们的方法在将多个图像视为同一底层事物的表达方面表现出色,而不仅仅将其视为像素的集合。实验证明,StableRep在ImageNet分类任务中,使用Vision Transformer模型,达到了76.7%的线性准确度。此外,通过引入语言监督,在2000万合成图像上训练的StableRep模型超越了使用5000万真实图像训练的CLIP模型的表现

然而,稳定生成器并非没有缺陷。它生成图像的速度较慢,同时在文本提示和生成图像之间存在语义不匹配的问题。此外,稳定生成器的底层模型稳定扩散需要在真实数据上进行初始训练,因此使用稳定生成器生成图像将需要更长时间且成本可能更高

StableRep已经在GitHub上开源,并可用于商业用途。它采用Apache2.0许可证,用户可以使用并生成衍生作品,但需要在重新分发的作品或衍生作品中提供Apache许可证的副本,并包含对更改的通知。许可证还包括对贡献者不对使用许可作品引起的任何损害负责的责任限制。 稳定副本(StableRep)已在GitHub上以开源方式发布,可用于商业目的。其采用了Apache2.0许可证,允许用户使用和创建衍生作品。然而,在重新分发或衍生作品中,用户需要提供Apache许可证的副本,并通知对所做的更改。该许可证还对贡献者对使用许可作品所造成的任何损害免责

麻省理工学院和谷歌的这项研究成果代表了人工智能图像生成领域的一次创新。尽管存在一些缺陷,但它提供了一种新的方法和思路来生成高质量的图像

以上是MIT和Google联合研究StableRep新技术:利用合成图像训练AI图像模型的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
如何在Google表中使用双子座?如何在Google表中使用双子座?Apr 26, 2025 am 09:34 AM

Google表可以通过引入Gemini's = AI功能,自动化以前需要手动努力的数据任务进行了重大升级。这种AI驱动的公式简化了通过简单的分类,汇总和公式开发

Python One Liners数据清洁:快速指南 - 分析VidhyaPython One Liners数据清洁:快速指南 - 分析VidhyaApr 26, 2025 am 09:33 AM

使用Python单线使数据清洁变得容易 用强大的Python单线简化数据清洁过程!本指南展示了用于处理缺失价值,重复,格式化问题等基本熊猫技术

为您的任务选择最佳AI聊天机器人的指南为您的任务选择最佳AI聊天机器人的指南Apr 26, 2025 am 09:31 AM

您如何跟踪最新的LLM?如果您一直在跟踪新闻,那么我确定您对那里的模型不知所措,尤其是在过去的几个月中。今天,我们的AI聊天机器人比FI更多

14个强大的技术定义嵌入的演变-Analytics Vidhya14个强大的技术定义嵌入的演变-Analytics VidhyaApr 26, 2025 am 09:29 AM

本文探讨了文本嵌入的演变,从简单的基于计数的方法到复杂的上下文感知模型。 它突出了MTEB等排行榜在评估嵌入性能和尖端的可及性中的作用

O3 vs O4 -Mini vs Gemini 2.5 Pro:终极推理战 - 分析VidhyaO3 vs O4 -Mini vs Gemini 2.5 Pro:终极推理战 - 分析VidhyaApr 26, 2025 am 09:28 AM

该博客将三个领先的AI模型(O3,O4-Mini和Gemini 2.5 Pro)置于严格的推理挑战中。 我们在物理,数学,编码,网页设计和图像分析中测试它们的能力,揭示了它们的优势

在Yolo -Analytics Vidhya中进行有效的重新ID跟踪在Yolo -Analytics Vidhya中进行有效的重新ID跟踪Apr 26, 2025 am 09:26 AM

YOLO,SSD和DETR等实时对象检测工具对于监视对象运动和动作至关重要。 交通管理和安全等行业利用这些工具来跟踪和分析。但是,一个主要挑战是维护

生成AI数据科学家:蓬勃发展的新工作角色生成AI数据科学家:蓬勃发展的新工作角色Apr 26, 2025 am 09:22 AM

生成AI(Genai)数据科学家:蓬勃发展的职业道路 执行摘要: 生成AI的新兴领域需要专业人士熟练的大型数据集导航,LLM加速模型开发和现实世界中的AI部署。 蒂

如何将MCP与光标AI一起使用?如何将MCP与光标AI一起使用?Apr 26, 2025 am 09:21 AM

AI正在改变我们构建软件的方式。 MCP(模型上下文协议)和光标AI等工具正在领导这一转变。光标AI使您可以使用自然语言编写代码,而MCP则在顶部添加了智能处理和自动化。 tog

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。