美图自研的大模型3.0已经正式发布!
并且全面应用于美图旗下影像与设计产品。
图片
这是自美图大模型面世100天后的最新迭代。
相较于最初版本,3.0版能够生成更加真实细腻的画面细节。
图片
如上这些生成能力,在美图秀秀上能直接体验。
图片
最近正流行的AIGC玩法,在其中都能找到。
图片
美图公司的创始人、董事长兼CEO吴欣鸿透露,目前美图的大部分产品都已经融入了自己研发的大模型
除了影像和设计领域,美图自研大模型还将在电商、广告、游戏、动漫、影视五大行业发力。
美图秀秀可直接体验
美图自研大模型名叫MiracleVision(奇想智能)。
其最显着的特点是更懂美学。
美图将长期积累的美学认知融入到MiracleVision视觉大模型中,并建立了基于机器学习的美学评估系统,为模型生成的结果赋予了“美学分数”,以不断提升模型对美学的理解
所以美图也将自己的大模型称为是“艺术生和理科生的结合”。
目前MiracleVision3.0的最新能力在美图秀秀上即可体验。
图片
操作非常简单,比如使用涂鸦生成图,只需几笔简单的草图加上提示词,就能轻松地创建出复杂的模型
图片
在AI视觉创作工具“WHEE”上,可以获得更加专业的体验,并且能够控制更多的功能
举个例子,在"图生图"功能中,我们可以利用智能联想来生成更加完善的提示词
可以通过文字来控制不希望呈现的内容
图片
更进一步可控制生成图像风格。
图片
以及可以通过参数调整、画面控制能让生成图片更加符合自己的预期。
美图大模型MiracleVision现在已经涉足电商、游戏、动漫、广告和影视五大领域,旨在提高工作流程的效率
图片
MiracleVision自6月份首次发布以来经历了三次更新
- 1.0版本主要初步构建大模型架构和基础;
- 2.0版本联合了设计师、艺术院校老师学生共同构建了高质量数据集,使得大模型在美学方面达到更好状态;
- 3.0版本更强调模型的可控性,在细节和局部控制上做了提升,使得模型在技术层面达到更好效果。
图片
目前,美图AI视觉创作工具“WHEE”的AI效果生成数已超过550万张,已初步打造设计师生态;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者。
美图吴欣鸿也表示,目前美图全员都积极 embrace AI。随着人工智能与图像计算的融合趋势,美图制定了更明确的发展战略
比如快速推出自研大模型、布局五大行业,这些动作都基于美图对于AIGC趋势的理解和洞察。
上半年投3个亿做研发
最明显的一个方面是,美图对当前AIGC趋势活跃用户的理解
吴欣鸿表示,他们观察到如今离AIGC趋势最近的人,不是设计师,而是“传播者”。
主要以新媒体运营、电商运营和KOL为主的群体
没有专业从业者的“包袱”和高要求,同时又能向下连接更多普通人的这一群体,是美图目前的发力点之一。他们正在逐步开发更加完善的AI工具,构建工作流程
图片
美图同时认为,在大型模型的趋势下,它具有一个天生的优势,即能够迅速获得用户的反馈
作为一家成立已有15年的产品公司,美图已经构建起了足够庞大的用户群体,能够通过在自身平台上试水新功能,快速得到市场反馈并快速调整效果,这样能让大模型更高效地和实际场景结合起来。
作为AI能力的提供方,美图吴欣鸿认为,当前AI视觉大模型在生产端面临三个待解决的问题:垂直领域的极致效果、工作流整合和变现能力
一一对应来看,美图在这三方面已开始发力。
首先,美图通过快速迭代自研大模型,在100天内改进了模型的生成效果,使其更加丰富且可控。在满足用户新鲜体验的基础上,美图能够提供更具实用价值的图像设计作品
其二,美图选择了五大方向,面向生产者提供了AI设计工具。据透露,美图选择电商、游戏、动漫、广告和影视这几个行业,主要是看重了它们和互联网行业有更加原生的关系。这使得AI工具能更好融入其工作链路,整合工作流速度更快。
其三,变现能力。美图目前已经构建了一个创作者生态,这部分对AI感兴趣的创作者,可以将自己原创的AI视觉效果做成配方,在美图搭建的平台上售卖。这样一来,创作者能够获得更多收入,同时他们也能起到传播推广的作用,吸引更多人来使用AI视觉创作工具。
基于这些理解,今年美图正式提出了AI产品形态,包括底层、中间层和应用层。
底层为MiracleVision自研大模型。
中间层由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务
应用层由普通用户更熟悉的各类应用APP构成。
搭建三层架构的目的,基本上是从产品的角度出发的
就以底层研发为例,美图旗下的美图影像研究院(MT Lab)在2010年成立。目前,公司大模型研发相关人员约有600人
今年上半年公司研发投入2.94亿元,同比增长10.8%。
美图公司表示,他们在进行研发时遵循更加务实的逻辑,即考虑到是否能够实际增长用户和收入。同时,他们相信这一切都可以通过实际业绩来证明
今年上半年,美图公司实现总收入12.61亿元,同比增长29.8%。月活跃用户数达2.47亿,同比增长2.5%。VIP会员数超720万,创下历史新高。以VIP订阅为主的影像与设计产品业务收入6.02亿元,同比增长62.2%;美业解决方案业务收入2.86亿元,同比增长31.1%;广告业务收入3.49亿元,同比增长28.2%;其他业务收入2309万元。
不过回到当下,美图也坦言视觉大模型应用还正处在探索期。当下很多应用开发都是齐头并进,各家也都在摸索路径。
吴欣鸿认为,视觉大模型的应用普及将经历三个阶段:探索期将在2024年之前,高速发展期将在2024-2025年,成熟期将在2026-2030年
图片
要成功穿越周期,需要具备审视趋势的能力,并且需要有实实在在的资金支持
就以当下让厂商们焦虑的算力问题,美图透露目前正在和多家云厂商合作,有充足算力可以使用。
吴欣鸿进一步补充说,美图很幸运能够通过订阅和单独购买获得回报
以上是美图秀秀上车最新自研大模型,各类AIGC玩法可直接体验的详细内容。更多信息请关注PHP中文网其他相关文章!

用Microsoft Power BI图来利用数据可视化的功能 在当今数据驱动的世界中,有效地将复杂信息传达给非技术观众至关重要。 数据可视化桥接此差距,转换原始数据i

专家系统:深入研究AI的决策能力 想象一下,从医疗诊断到财务计划,都可以访问任何事情的专家建议。 这就是人工智能专家系统的力量。 这些系统模仿Pro

首先,很明显,这种情况正在迅速发生。各种公司都在谈论AI目前撰写的代码的比例,并且这些代码的比例正在迅速地增加。已经有很多工作流离失所

从数字营销到社交媒体的所有创意领域,电影业都站在技术十字路口。随着人工智能开始重塑视觉讲故事的各个方面并改变娱乐的景观

ISRO的免费AI/ML在线课程:通向地理空间技术创新的门户 印度太空研究组织(ISRO)通过其印度遥感研究所(IIR)为学生和专业人士提供了绝佳的机会

本地搜索算法:综合指南 规划大规模活动需要有效的工作量分布。 当传统方法失败时,本地搜索算法提供了强大的解决方案。 本文探讨了爬山和模拟

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

Chip Giant Nvidia周一表示,它将开始制造AI超级计算机(可以处理大量数据并运行复杂算法的机器),完全是在美国首次在美国境内。这一消息是在特朗普总统SI之后发布的


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

SublimeText3汉化版
中文版,非常好用

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)