作者:余生
AIGC时代已来,元宇宙还有多远?
推荐阅读:
AIGC「生成力」|1号AIGC季①
克服AI焦虑的最好办法,就是「加入AIGC」|1号AIGC季发刊词
2023年,AIGC一路「狂飙」。
美国人工智能研究公司OpenAI研发的AI对话模型ChatGPT点燃了AIGC的星星之火,在短时间内掀起了一股燎原之势,随后,百度「文心一言」、商汤科技「日日新sensenova」等国内各种大模型产品相继推出。
不仅如此,AIGC在图片、音频、视频等各个领域也轮番上新。根据艾媒咨询数据,预计2023年中国AIGC行业核心市场规模为79.3亿元,2028年将达2767.4亿元。
相较而言,此前频繁出现在大众视野中的「元宇宙」这一概念似乎受到了冷落。但实际上,AIGC和元宇宙相辅相成,二者之间并不存在此消彼长的问题。
那么,AIGC能够为元宇宙带来什么样的技术加持?当前AIGC带来的「行业震颤」之感能否持续,能否转换成元宇宙内容和应用场景建设过程中的赋能效应?我们与元宇宙的距离到底还有多远?
带着这些问题,1号采访了广州虚拟影业有限公司市场部总监荆茂森、杭州优链时代有限公司创始人兼CEO蒋亚洪,尝试从元宇宙中的「人」的角度出发,谈一谈AIGC能为元宇宙里的「人」做些什么。
重点突破:为AI虚拟人注入灵魂
「虚拟人是未来元宇宙中一个非常重要的概念。」
在虚拟影业荆茂森看来,不论是真人驱动的数字化身,还是元宇宙内所谓的NPC,他们都是元宇宙不可或缺的存在。但是要创造出足够量的虚拟人以供元宇宙的正常运转,就必然不可能做到全部都由真人来驱动。
AI虚拟人的重要性不言而喻。
自2018年以来,腾讯、百度、阿里巴巴等众多互联网大厂和传媒公司纷纷布局数字虚拟人业务。新华社及腾讯「小诤」、阿里巴巴「AYAYI」、浙江卫视「谷小雨」、芒果超媒「YAOYAO」等虚拟数字人数不胜数。
但AI虚拟人的致命弱点在于,虚拟人没有灵魂。
换言之,我们对于当前市场上AI虚拟人的的理解大部分都还停留在,这是一个没有灵魂,没法理解人类表词达意的AI机器人,而非真正能够与其进行交流沟通的虚拟人。荆茂森也表示,目前AI驱动的虚拟人的确存在诸如动作生硬、表情不够灵动、声音没有情感、反馈效率低下等方面的问题,这在一定程度上限制了虚拟人行业的发展。
不过,ChatGPT走红之后,许多业内人士有了「ChatGPT为AI虚拟人注入灵魂」的思考。
以GPT-4为例,作为一个多模态预训练大模型,它可以同时接受图像和文本输入,并据此给出相应的回答。相较于初代ChatGPT而言,GPT-4展现出的问题解决能力和沟通交流能力得到了显著提高。
那么,「ChatGPT为AI虚拟人注入灵魂」的设想,可行吗?
荆茂森认为,这条路径是可能实现的。
基于ChatGPT的预训练模型和强大的知识库,虚拟人可以在接收到相应指令后迅速调取数据库内的相关信息,并在短时间内给出相应的回复,从而实现ChatGPT与虚拟人之间的优势互补,让虚拟人与人的互动更加接近人类的日常交流表达状态。
2月1日,国内虚拟技术服务商世优科技宣布其数字人业务已经ChatGPT这个AI「大脑」,正在通过数字人自身的人设背景等相关数据集,并基于OpenAI对数字人专有大脑形成个性化模型训练。除此之外,元境科技、开普云等公司也表示,公司数字人相关业务已接入ChatGPT,提升和强化虚拟数字人相关业务能力。
在此基础上,荆茂森预测,未来虚拟人行业将迎来新一轮的革新和升级。
具体而言,未来虚拟人行业将朝着「质」和「量」两种不同的方向发展。
其一是一部分质量上乘的虚拟人将继续优化和完善,朝着高精尖的方向发展。譬如虚拟影业长期以来都在虚拟人的形象打造和模型制作方面精耕细作,其打造的虚拟人「鹤追」扎根于影视领域,已经参演了多部影视动画作品,网络触达力过亿人次。
其二是AI驱动的功能性、应用性的虚拟人数量将大幅增长并全面铺开。「包括ChatGPT在内的大模型产品,以及AI作图、AI建模等相关技术,都将使得虚拟人行业的资产成本得到下降。许多中小型的创业公司也可以在这个领域中获得相当程度的发展机会,那么整个行业也会变得更加繁荣。」
全面赋能:再造一个地球的时间加速
从信息传播的介质层面划分来看,AIGC相关公司产业布局的主要领域为:文字、图片、音频和视频。
但从AIGC涉及的相关行业领域来看,AIGC其实已经嵌入到了资讯、游戏、媒体与影视创作、电子商务、金融咨询等各个领域,对我们日常生活的方方面面产生深刻影响。
同样地,AIGC也将实现对于元宇宙建设的全面赋能。
优链时代创始人CEO蒋亚洪从自身对于元宇宙的设想出发,对于AIGC在元宇宙的空间搭建、内容生成、体验场景等方面的赋能做了详细阐述。
他认为,要谈到AIGC如何赋能元宇宙,首先要思考的是元宇宙的「人」如何在虚拟世界中生活、工作和消费。「在元宇宙中,无论是和同事在一起工作,还是社交和娱乐,我们都需要有自己的数字化身,并且能够去体验元宇宙的各种应用场景,而不用受到空间限制。」
真人3D数字人作为元宇宙的基础建设,有着非常广阔的应用前景,包括元宇宙会议、文博文旅、大学、线下展厅、影视、游戏娱乐、品牌推广等。
如今,优链时代已经在文旅场景、电影创作、游戏娱乐、品牌推广、线下展厅等,尤其是数字化身的即时生成方面有了实际的落地产品优链3D云阵相机,这款商用级创建元宇宙真人数字人的智能设备,能够一秒拍摄创建,最快5分钟生成真人3D数字分身,成本只要100元,为创建数字分身之路实现了“消费级”突破。蒋亚洪表示,AIGC的发展将为即时生成性数字化身的精准度和应用场景的开拓等方面带来全新机遇。
具体到元宇宙中的「人」本身这个层面而言,除了为虚拟人装上「大脑」之外,AIGC还可以在虚拟人的形象绘制、模型生成与构建方面大幅提升制作效率,同时也可以在虚拟人的表情与动作表现的灵活性与真实性,以及声音输出的拟人化等方面带来质的发展。
例如,国际3D引擎巨头Unity中国高级经理兼跨端移植技术负责人孙志鹏在接受《每日经济新闻》记者采访时表示,对应AI作画,3D引擎可能实现「一句话建模」。
又如,荆茂森在采访中特别提到了AI动作捕捉技术。
一直以来,虚拟人行业在动作捕捉领域的投入和维护成本非常高,「仅仅是搭建一个光学动作捕捉棚,需要投入的资金成本都要达到几百万,这对许多初创型企业而言是极高的投入成本。」
而AI动作捕捉技术,则能够基于一段拍摄好的视频,实现对对视频画面中人物动作的精准识别与复刻,自动生成虚拟人的骨骼动作数据。在此基础上,将该数据赋予到虚拟人的3D模型上,就可以完成虚拟人的动作驱动。
在这个过程中,既不需要昂贵的专业动作捕捉设备,也不需要专门的人员佩戴动捕设备驱动虚拟人,在降低动捕成本的同时提高了动捕效率,一举两得。
如此来看,AIGC对于元宇宙中「人」的赋能是全方位的。
一方面,AIGC能够为元宇宙的场景构建提供扎实的技术支撑,为「人」在元宇宙中的各种活动开拓新的空间;另一方面,AIGC本身在虚拟人制作领域的应用也将使得虚拟人的制作成本得以下降,让更多人有机会在元宇宙中拥有属于自己的数字化身。
最终,元宇宙终极形态的达成时间得以加速。
荆茂森提到,元宇宙要在生活中实现落地,其实相当于在虚拟世界中再造一个地球,其耗费的工程量和资产量巨大。在这个过程中,如果有AI辅助,那么再造一个地球的时间会加快一点。
回归现实:我们与元宇宙的距离
「AIGC时代来临了。」
荆茂森坦言,这是他在感受到ChatGPT在高灵活度、高精准度和高反馈效率之后的第一感受。
诸如ChatGPT将取代人们80%的工作岗位、AI绘画又将取代中底层原画师岗位之类的论断甚嚣尘上。而与此同时,ChatGPT研究员、算法工程师等新的岗位正在诞生,对于人的计算机技术运用能力提出了更高要求。
「由AI绘制的《太空歌剧院》」
这并非不经之谈。
生成式AI整合了计算机视觉、数据挖掘、机器学习、智能语音技术、自然语言处理、知识图谱等多种核心AI技术,可以在创意、表现力、迭代、传播、个性化等方面发挥显著优势。但是1号在采访过程中了解到,AIGC在实际落地过程中,存在「理想」与「现实」之间的矛盾问题。
2022年7月,百度CEO李彦宏在2022年百度世界大会上判断,AIGC将走过3个发展阶段:一是「助手阶段」,AIGC用以辅助人类进行内容生产;二是「协作阶段」,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;三是「原创阶段」,AIGC将独立完成内容创作。
而如今,我们正处于「协作阶段」和「原创阶段」的交织期。
例如在虚拟人行业,可以通过接入ChatGPT等大模型在一定程度上解决「虚拟人没有灵魂」的问题,但在实际操作和应用落地过程中,还需要考虑到自然语言处理和转换,信息反馈效率不足等问题。
只有当虚拟人具备足够的真实性和生动性,才能够发挥出虚拟人的最大价值。
「现在大家对于AI的预期没有那么高。」荆茂森分析道,大部分人是以一种体验性的心态来看待当前的AIGC技术,但是在AIGC相关应用的真正落地阶段,那些AI绘画没能画好的手,ChatGPT没能理解的人类需求,才是决定未来AIGC发展的关键一环。
可以说,当前AIGC的火爆只是元宇宙尚未步入真正繁荣阶段之前的前奏,我们距离设想中「终极形态」的元宇宙还有很长一段路要走。
蒋亚洪也表示,当前的元宇宙还处于发轫阶段,元宇宙相关应用的实际落地至少还需要3年左右的时间。他坦言,优链时代正在从事的拍摄和制作数字化身工作也只是元宇宙搭建过程中的一部分内容,不过也是元宇宙很重要的基础建设,真人数字分身有巨大前景,市场静待爆发。
除此之外,还有一个问题在于,元宇宙的相关消费和应用场景尚未完全打开。以虚拟人行业为例,当前虚拟人的应用市场主要在于传媒和娱乐领域,山魈映画打造的超写实数字人「梅涩甜」,主要活跃于活跃在知识科普、脱口秀表演、时尚生活、文艺创作等领域。
大多数人只是作为旁观者,并非作为参与者、体验者而与虚拟人阐述直接的互动与交流,因而很难对虚拟人有更为直观的观察和了解。相应地,元宇宙也是如此,只有当足够多的人参与其中,元宇宙的雏形才算是初步建立了。
对此,蒋亚洪表示,元宇宙的核心要素应该包括空间、人、内容和场景,如果从商业的角度而言,元宇宙中的「人、货、场」都应该能够快速的体现出来。「在此基础上,才能够进一步发挥出虚拟人行业的经济价值,体现出元宇宙的应有要义。」
1号结语
2022年10月,AIGC 初创公司 Jasper获得1.25亿美元A轮融资。从诞生之初的默默无闻到成为独角兽企业后的名声大噪,Jasper仅用了18个月。
包括Jasper在内,搭乘AIGC东风得以迅速发展的企业数不胜数。可以预见的是,随着资本的大量涌入和市场规模的迅速扩大,AIGC行业将迎来新一轮快速发展期。
4月19日,学者喻国明在一场名为《元宇宙、AIGC与传播革命——从ChatGPT到全面智能化时代的未来》的讲座中从12个方面系统揭示了以ChatGPT为主的AIGC即将带来全新的智能互联时代,而元宇宙则是数字智能时代的必然产物。
不得不承认,AIGC的火爆让我们从对元宇宙漂浮的幻想和探讨中沉了下来,开始看到驱动元宇宙发展的核心技术引擎:AI和AIGC。或许在未来,可以借用AIGC这把钥匙,真正打开进入元宇宙的大门。
以上是AIGC能为元宇宙里的「人」做些什么?|1号AIGC季②的详细内容。更多信息请关注PHP中文网其他相关文章!

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

Dreamweaver Mac版
视觉化网页开发工具

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中