美图自研的大模型3.0已经正式发布!
并且全面应用于美图旗下影像与设计产品。
图片
这是自美图大模型面世100天后的最新迭代。
相较于最初版本,3.0版能够生成更加真实细腻的画面细节。
图片
如上这些生成能力,在美图秀秀上能直接体验。
图片
最近正流行的AIGC玩法,在其中都能找到。
图片
美图公司的创始人、董事长兼CEO吴欣鸿透露,目前美图的大部分产品都已经融入了自己研发的大模型
除了影像和设计领域,美图自研大模型还将在电商、广告、游戏、动漫、影视五大行业发力。
美图秀秀可直接体验
美图自研大模型名叫MiracleVision(奇想智能)。
其最显著的特点是更懂美学。
美图将长期积累的美学认知融入到MiracleVision视觉大模型中,并建立了基于机器学习的美学评估系统,为模型生成的结果赋予了“美学分数”,以不断提升模型对美学的理解
所以美图也将自己的大模型称为是“艺术生和理科生的结合”。
目前MiracleVision3.0的最新能力在美图秀秀上即可体验。
图片
操作非常简单,比如使用涂鸦生成图,只需几笔简单的草图加上提示词,就能轻松地创建出复杂的模型
图片
在AI视觉创作工具“WHEE”上,可以获得更加专业的体验,并且能够控制更多的功能
举个例子,在"图生图"功能中,我们可以利用智能联想来生成更加完善的提示词
可以通过文字来控制不希望呈现的内容
图片
更进一步可控制生成图像风格。
图片
以及可以通过参数调整、画面控制能让生成图片更加符合自己的预期。
美图大模型MiracleVision现在已经涉足电商、游戏、动漫、广告和影视五大领域,旨在提高工作流程的效率
图片
MiracleVision自6月份首次发布以来经历了三次更新
- 1.0版本主要初步构建大模型架构和基础;
- 2.0版本联合了设计师、艺术院校老师学生共同构建了高质量数据集,使得大模型在美学方面达到更好状态;
- 3.0版本更强调模型的可控性,在细节和局部控制上做了提升,使得模型在技术层面达到更好效果。
图片
目前,美图AI视觉创作工具“WHEE”的AI效果生成数已超过550万张,已初步打造设计师生态;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者。
美圖吳欣鴻也表示,目前美圖全員都積極 embrace AI。隨著人工智慧與影像運算的融合趨勢,美圖制定了更明確的發展策略
例如快速推出自研大模型、佈局五大產業,這些動作都基於美圖對於AIGC趨勢的理解和洞察。
上半年投3個億做研發
最明顯的一個方面是,美圖對當前AIGC趨勢活躍用戶的理解
吳欣鴻表示,他們觀察到如今離AIGC趨勢最近的人,不是設計師,而是「傳播者」。
主要以新媒體營運、電商營運和KOL為主的群體
沒有專業從業者的「包袱」和高要求,同時又能向下連結更多普通人的這群人,是美圖目前的發力點之一。他們正在逐步開發更完善的AI工具,建立工作流程
圖片
美圖同時認為,在大型模型的趨勢下,它具有一個天生的優勢,即能夠迅速獲得用戶的反饋
作為一家成立已有15年的產品公司,美圖已經構建起了足夠龐大的用戶群體,能夠透過在自身平台上試水新功能,快速得到市場回饋並快速調整效果,這樣能讓大模型更有效率地和實際場景結合。
作為AI能力的提供方,美圖吳欣鴻認為,當前AI視覺大模型在生產端面臨三個待解決的問題:垂直領域的極致效果、工作流程整合和變現能力
一一對應來看,美圖在這三方面已開始發力。
首先,美圖透過快速迭代自研大模型,在100天內改進了模型的生成效果,使其更加豐富且可控。在滿足使用者新鮮體驗的基礎上,美圖能夠提供更實用價值的影像設計作品
其二,美圖選擇了五大方向,並為生產者提供了AI設計工具。據透露,美圖選擇電商、遊戲、動漫、廣告和影視這幾個產業,主要是看重了它們和網路產業有更原生的關係。這使得AI工具能更好地融入其工作鏈路,整合工作流程速度更快。
其三,變現能力。美圖目前已經建構了一個創作者生態,這部分對AI有興趣的創作者,可以將自己原創的AI視覺效果做成配方,在美圖搭建的平台上販售。這樣一來,創作者能夠獲得更多收入,同時他們也能起到傳播推廣的作用,吸引更多人來使用AI視覺創作工具。
基於這些理解,今年美圖正式提出了AI產品形態,包括底層、中間層和應用層。
底層為MiracleVision自研大模型。
中間層由美圖AI開放平台、美圖創意平台、美圖AI助理RoboNeo組合而成,分別負責開放共享AI技術、搭建創作者生態、聚合美圖影像服務
應用層由一般使用者較熟悉的各類應用APP構成。
搭建三層架構的目的,基本上是從產品的角度出發的
就以底層研發為例,美圖旗下的美圖影像研究院(MT Lab)在2010年成立。目前,公司大模型研發相關人員約有600人
今年上半年公司研發投入2.94億元,年增10.8%。
美圖公司表示,他們在進行研發時遵循更務實的邏輯,即考慮到是否能夠實際成長用戶和收入。同時,他們相信這一切都可以透過實際業績來證明
今年上半年,美圖公司實現總收入12.61億元,年增29.8%。月活躍用戶數達2.47億,年增2.5%。 VIP會員數超720萬,創下歷史新高。以VIP訂閱為主的影像與設計產品業務收入6.02億元,年增62.2%;美業解決方案業務收入2.86億元,年增31.1%;廣告業務收入3.49億元,年增28.2%;其他業務收入2309萬元。
不過回到當下,美圖也坦言視覺大模型應用仍正處於探索期。當下許多應用程式開發都是齊頭並進,各家也都在摸索路徑。
吳欣鴻認為,視覺大模型的應用普及將經歷三個階段:探索期將在2024年之前,高速發展期將在2024-2025年,成熟期將在2026-2030年
圖片
要成功穿越週期,需要具備審視趨勢的能力,並且需要有實實在在的資金支持
就以當下讓廠商們焦慮的算力問題,美圖透露目前正在和多家雲廠商合作,有充足算力可以使用。
吳欣鴻進一步補充說,美圖很幸運能夠透過訂閱和單獨購買獲得回報
以上是美圖秀上車最新自研大模型,各類AIGC玩法可直接體驗的詳細內容。更多資訊請關注PHP中文網其他相關文章!

輕鬆在家運行大型語言模型:LM Studio 使用指南 近年來,軟件和硬件的進步使得在個人電腦上運行大型語言模型 (LLM) 成為可能。 LM Studio 就是一個讓這一過程變得輕鬆便捷的優秀工具。本文將深入探討如何使用 LM Studio 在本地運行 LLM,涵蓋關鍵步驟、潛在挑戰以及在本地擁有 LLM 的優勢。無論您是技術愛好者還是對最新 AI 技術感到好奇,本指南都將提供寶貴的見解和實用技巧。讓我們開始吧! 概述 了解在本地運行 LLM 的基本要求。 在您的電腦上設置 LM Studi

蓋伊·佩里(Guy Peri)是麥考密克(McCormick)的首席信息和數字官。儘管他的角色僅七個月,但Peri正在迅速促進公司數字能力的全面轉變。他的職業生涯專注於數據和分析信息

介紹 人工智能(AI)不僅要理解單詞,而且要理解情感,從而以人的觸感做出反應。 這種複雜的互動對於AI和自然語言處理的快速前進的領域至關重要。 Th

介紹 在當今以數據為中心的世界中,利用先進的AI技術對於尋求競爭優勢和提高效率的企業至關重要。 一系列強大的工具使數據科學家,分析師和開發人員都能構建,Depl

本週的AI景觀爆炸了,來自Openai,Mistral AI,Nvidia,Deepseek和Hugging Face等行業巨頭的開創性發行。 這些新型號有望提高功率,負擔能力和可訪問性,這在TR的進步中推動了

但是,該公司的Android應用不僅提供搜索功能,而且還充當AI助手,並充滿了許多安全問題,可以將其用戶暴露於數據盜用,帳戶收購和惡意攻擊中

您可以查看會議和貿易展覽中正在發生的事情。您可以詢問工程師在做什麼,或諮詢首席執行官。 您看的任何地方,事情都以驚人的速度發生變化。 工程師和非工程師 有什麼區別

模擬火箭發射的火箭發射:綜合指南 本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。 我們將介紹從定義火箭組件到分析模擬的所有內容


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3漢化版
中文版,非常好用

Dreamweaver Mac版
視覺化網頁開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。