首頁 >科技週邊 >人工智慧 >美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗

王林
王林轉載
2023-10-11 11:29:011399瀏覽

美图自研的大模型3.0已经正式发布!

并且全面应用于美图旗下影像与设计产品。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

这是自美图大模型面世100天后的最新迭代。

相较于最初版本,3.0版能够生成更加真实细腻的画面细节。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

如上这些生成能力,在美图秀秀上能直接体验。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

最近正流行的AIGC玩法,在其中都能找到。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

美图公司的创始人、董事长兼CEO吴欣鸿透露,目前美图的大部分产品都已经融入了自己研发的大模型

除了影像和设计领域,美图自研大模型还将在电商、广告、游戏、动漫、影视五大行业发力。

美图秀秀可直接体验

美图自研大模型名叫MiracleVision(奇想智能)。

其最显著的特点是更懂美学。

美图将长期积累的美学认知融入到MiracleVision视觉大模型中,并建立了基于机器学习的美学评估系统,为模型生成的结果赋予了“美学分数”,以不断提升模型对美学的理解

所以美图也将自己的大模型称为是“艺术生和理科生的结合”。

目前MiracleVision3.0的最新能力在美图秀秀上即可体验。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

操作非常简单,比如使用涂鸦生成图,只需几笔简单的草图加上提示词,就能轻松地创建出复杂的模型

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

在AI视觉创作工具“WHEE”上,可以获得更加专业的体验,并且能够控制更多的功能

举个例子,在"图生图"功能中,我们可以利用智能联想来生成更加完善的提示词

可以通过文字来控制不希望呈现的内容

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

更进一步可控制生成图像风格。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

以及可以通过参数调整、画面控制能让生成图片更加符合自己的预期。

美图大模型MiracleVision现在已经涉足电商、游戏、动漫、广告和影视五大领域,旨在提高工作流程的效率

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

MiracleVision自6月份首次发布以来经历了三次更新

  • 1.0版本主要初步构建大模型架构和基础;
  • 2.0版本联合了设计师、艺术院校老师学生共同构建了高质量数据集,使得大模型在美学方面达到更好状态;
  • 3.0版本更强调模型的可控性,在细节和局部控制上做了提升,使得模型在技术层面达到更好效果。

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗图片

目前,美图AI视觉创作工具“WHEE”的AI效果生成数已超过550万张,已初步打造设计师生态;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者。

美圖吳欣鴻也表示,目前美圖全員都積極 embrace AI。隨著人工智慧與影像運算的融合趨勢,美圖制定了更明確的發展策略

例如快速推出自研大模型、佈局五大產業,這些動作都基於美圖對於AIGC趨勢的理解和洞察。

上半年投3個億做研發

最明顯的一個方面是,美圖對當前AIGC趨勢活躍用戶的理解

吳欣鴻表示,他們觀察到如今離AIGC趨勢最近的人,不是設計師,而是「傳播者」。

主要以新媒體營運、電商營運和KOL為主的群體

沒有專業從業者的「包袱」和高要求,同時又能向下連結更多普通人的這群人,是美圖目前的發力點之一。他們正在逐步開發更完善的AI工具,建立工作流程

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗圖片

美圖同時認為,在大型模型的趨勢下,它具有一個天生的優勢,即能夠迅速獲得用戶的反饋

作為一家成立已有15年的產品公司,美圖已經構建起了足夠龐大的用戶群體,能夠透過在自身平台上試水新功能,快速得到市場回饋並快速調整效果,這樣能讓大模型更有效率地和實際場景結合。

作為AI能力的提供方,美圖吳欣鴻認為,當前AI視覺大模型在生產端面臨三個待解決的問題:垂直領域的極致效果、工作流程整合和變現能力

一一對應來看,美圖在這三方面已開始發力。

首先,美圖透過快速迭代自研大模型,在100天內改進了模型的生成效果,使其更加豐富且可控。在滿足使用者新鮮體驗的基礎上,美圖能夠提供更實用價值的影像設計作品

其二,美圖選擇了五大方向,並為生產者提供了AI設計工具。據透露,美圖選擇電商、遊戲、動漫、廣告和影視這幾個產業,主要是看重了它們和網路產業有更原生的關係。這使得AI工具能更好地融入其工作鏈路,整合工作流程速度更快。

其三,變現能力。美圖目前已經建構了一個創作者生態,這部分對AI有興趣的創作者,可以將自己原創的AI視覺效果做成配方,在美圖搭建的平台上販售。這樣一來,創作者能夠獲得更多收入,同時他們也能起到傳播推廣的作用,吸引更多人來使用AI視覺創作工具。

基於這些理解,今年美圖正式提出了AI產品形態,包括底層、中間層和應用層。

底層為MiracleVision自研大模型。

中間層由美圖AI開放平台、美圖創意平台、美圖AI助理RoboNeo組合而成,分別負責開放共享AI技術、搭建創作者生態、聚合美圖影像服務

應用層由一般使用者較熟悉的各類應用APP構成。

搭建三層架構的目的,基本上是從產品的角度出發的

就以底層研發為例,美圖旗下的美圖影像研究院(MT Lab)在2010年成立。目前,公司大模型研發相關人員約有600人

今年上半年公司研發投入2.94億元,年增10.8%。

美圖公司表示,他們在進行研發時遵循更務實的邏輯,即考慮到是否能夠實際成長用戶和收入。同時,他們相信這一切都可以透過實際業績來證明

今年上半年,美圖公司實現總收入12.61億元,年增29.8%。月活躍用戶數達2.47億,年增2.5%。 VIP會員數超720萬,創下歷史新高。以VIP訂閱為主的影像與設計產品業務收入6.02億元,年增62.2%;美業解決方案業務收入2.86億元,年增31.1%;廣告業務收入3.49億元,年增28.2%;其他業務收入2309萬元。

不過回到當下,美圖也坦言視覺大模型應用仍正處於探索期。當下許多應用程式開發都是齊頭並進,各家也都在摸索路徑。

吳欣鴻認為,視覺大模型的應用普及將經歷三個階段:探索期將在2024年之前,高速發展期將在2024-2025年,成熟期將在2026-2030年

美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗圖片

要成功穿越週期,需要具備審視趨勢的能力,並且需要有實實在在的資金支持

就以當下讓廠商們焦慮的算力問題,美圖透露目前正在和多家雲廠商合作,有充足算力可以使用。

吳欣鴻進一步補充說,美圖很幸運能夠透過訂閱和單獨購買獲得回報

以上是美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除