搜索
首页科技周边人工智能苹果头显降临,AI虚拟人的救星还是流星?

苹果头显降临,AI虚拟人的救星还是流星?

Jun 11, 2023 am 11:16 AM
苹果头显ai虚拟人救星流星

作者|苏小如

苹果头显降临,AI虚拟人的救星还是流星?

AIGC火得一塌糊涂,元宇宙是不是被人遗忘了?

随着苹果发布售价高达2.4万元的新款AR眼镜 Vision Pro,本来已经沉寂了一段时间的AR和VR又一次回到了大家关注的中心位置。

谁是最先为AR和VR做好准备,并且是最早重新兴奋起来的?当然就是做虚拟人、数字人的一系列公司。虚拟人技术是跟文娱结合非常紧密的一种技术。而在稍早前的元宇宙概念下,和现在的AIGC时代中,虚拟人都有很多能与热点相融合的地方。

与AIGC概念相结合,是今年上半年行业的最大主题。本月初,网红“半藏森林”的数字克隆人上线,用户可采用包月或包年的形式享受语音、通话等服务。由于AI代替了真人驱动,数字人可以7x24不眠不休地工作,使产能大为提升。

这里所说的在直播过程中依靠真人即“中之人”表演来驱动,是虚拟人的“传统流派”之一。随着人工智能的不断进化,完全由程序或AI驱动,随机应变地提供问答已经成为虚拟人行业另一条主要的发展方向。

在实现AI虚拟人的技术路线上,目前也分成两种:一种是将大模型私有化部署,另一种是在已有开源模型基础上,进行针对性的二次开发。

苹果头显降临,AI虚拟人的救星还是流星? 表1 本文采访的三家虚拟人公司的类型划分 制表/娱乐资本论

在本文中,娱乐资本论将带您走进三家典型的虚拟人技术开发商,探索AI为它们的产品研发和商业模式带来了哪些改变。

AIGC虚拟内容平台云舶以面向直播播主的“小K直播姬”为载体,用游戏化的方式探索搭建深层次的直播生态;

专注端到端生成式AI虚拟人技术的中科深智主打商家带货“自动播”,刚刚发布自有的大模型,以显著提升虚拟人问答互动的效果;

跨模态智能软件服务公司迈吉客在为企业提供全自动虚拟主播的同时,也利用企业内部数据训练专有模型,培育企业的内部数据库和搜索引擎。

苹果头显降临,AI虚拟人的救星还是流星?

AIGC的四种打开方式

很多B站直播的主播和观众对小K直播姬都绝不会感到陌生。小K直播姬采用RGB 摄像头,在采集2D图片动作数据的基础上,用算法生成3D动作数据,形成了技术上的护城河。用户可以直接使用小K直播姬打造自己的直播虚拟人。

“我们做了3年才搭建了底层算法,拥有私有训练数据集,产品初见成效。”

2017年,梅嵩辞去蓝港互动游戏制作人的工作,投身人工智能行业,创建了云舶科技,这就是小K直播姬的开发商。游戏和AI行业的双重背景,也让云舶的商业模式显得非常独特。

苹果头显降临,AI虚拟人的救星还是流星? AI作图 by娱乐资本论

“我们公司的业务范围ToB、 ToC兼具。产品包括小K AI动捕、AI绘图、虚拟人引擎等,也有自营的MCN公会和主播基地。此外,公司也面对直播、游戏、电商三大核心场景,为企业提供虚拟人,虚拟内容服务。”

专注于端到端生成式AI虚拟人技术的中科深智,5月10日正式发布自有大模型,名叫“GenSense数智姜尚”。

“Open AI公布了训练方法后,大模型的入场卷难度变低,企业是否要自建大模型,主要取决于大模型的商业空间。”中科深智的创始人与CEO成维忠说。“2020年年初,我们便基于transformer做跨模态的训练工作,在数据清洗上也有经验。”

“我们做大模型主要是两个方面,一是未来的多模态训练会基于大语言模型,垂直领域的底层算法需要依靠大模型开展。二是很多客户提出做私有化部署,这要求算力能降下来。接入其他大模型,那我们也拿不到源代码和数据集。”

苹果头显降临,AI虚拟人的救星还是流星?

中科深智的业务范围,除了虚拟直播、数字员工等,也有金融、医疗、政企等企业的B端私有化部署业务。公司的虚拟人实时交互和应答系统“云小七”、元宇宙电商和虚拟人直播工具“百宝箱自动播&虚拟助播”、AI快速动画生成系统“自动画”等均已上线。

目前中科深智“自动播”的客户占据了天猫、淘宝、京东等平台使用AI虚拟人的中腰部品牌商家中70%以上的份额。他们近期推出了一款虚拟助理的产品,可以实现真人和虚拟人同时出镜。

苹果头显降临,AI虚拟人的救星还是流星?

“打造虚拟人端到端的工作是我们的目标。用户输入文本后,可以直接自动建模成3D人物,实时生成动作表情,形成内容输出。”成维忠指出,公司要为企业提供全链路的解决方案。

迈吉客科技给自己的一个标签是“跨模态”,该公司专注于智能数字资产和智能生成领域,主要产品是智能内容生产、智能虚拟直播、千人千面的个性化智能互动,以及最近在中关村论坛上发布的新品-数智空间站,三维、实时、智能是其亮点优势。

早在2016年,迈吉客科技就开始进入AIGC领域,创始人兼董事长伏英娜说。

“我们没有采用人工标定数据语料,而是基于非结构化技术构建数据。比如,我们可以把企业内不同的数据文档分层处理,为企业建立跨模态搜索引擎,让企业数据智能生成内容,轻松实现交互。”

为企业做私有化部署的公司很多,但中小企业做大模型很困难,伏英娜认为其护城河在于基于开源大模型做组合创新“,其实,算法和模型在应用上可以并联、串联组合。迈吉客科技的底层技术是分层算法,这样的算法组合算力要求低,可以成本低、效率高的构建,基于小样本数据进行资源量迭代,最终形成可以进化的智能。”

苹果头显降临,AI虚拟人的救星还是流星?

盈利的想象空间在哪里?

虚拟人直播主要分为娱播、游播、电商直播三种。云舶的梅嵩认为,“从价值上看,虚拟人更适合于前两种。带货场景最核心的是货品,只要东西便宜,肯定有人买,东西贵了,谁都不好卖,虚拟直播解决不了货的问题。”

“虚拟人直播能改善真人直播时,无法和粉丝即时互动的特点。粉丝可以随时给虚拟主播打赏换装,虚拟直播内容更加具有交互性和丰富性。”梅嵩说,“高品质的直播内容肯定需要真人参与。”

打开B站,随处可以看到小K直播姬的“自来水”用户。梅嵩透露,小K直播姬在3D虚拟主播领域市场保有率达到 90%,全网服务的主播超40万,日活超过5000主播开播。在所有动捕直播工具当中,完全C端免费的就小K一支“独苗”。

“我不指望靠小K直播姬的产品收费,未来我希望能通过这款产品,吸引更多的主播使用,这些人自带粉丝有流量。后期,我可以利用空间场景做互动游戏,进行内容流量变现,类似游戏的联运模式。”

梅嵩认为,虚拟直播互动会分成三个阶段。1. 0时代是日常的真人直播,打赏个礼物,播放特效,有弹幕。2.0粉丝可以通过弹幕礼物影响直播间虚拟内容或创建角色等,但粉丝没有操控性。3.0就是元宇宙空间,粉丝和主播可以自由直播互动,粉丝有虚拟摇杆拥有完全的自主控制,比如开演唱会、玩PK等。今年下半年,云舶会推出类似“元宇宙”的“小K空间站”,落地直播互动的第三代场景。

迈吉客科技的伏英娜认为,不同平台对虚拟人直播的政策不同。“抖音不会鼓励,但B站很可能会鼓励,毕竟用户不同。未来平台可以单独出虚拟人直播专区,毕竟有受众在。”

另一方面,“长远看来,虚拟人替代真人是在薅平台羊毛,侵犯平台利益,未来一定会被封杀掉。”中科深智的成维忠说,之前的数字人带货直播爆火,是因为抖音要扶持本地生活的业绩。

苹果头显降临,AI虚拟人的救星还是流星?

“未来的虚拟人直播带货,一定是跟平台间处于多赢的状态。虚拟人技术供应商应该想清楚平台、用户、商家需要什么。虚拟主播应该具备真人没有的推理、分析能力等,比如可以即时分析判断弹幕氛围是否正面,这才是人工智能的价值。”

苹果头显降临,AI虚拟人的救星还是流星?

AI+VR:未来有多美好

说到大模型,成维忠表示:“训练深层次AI需要大量语料,这都是OpenAI们的存量应用场景。更重要的是,深层次AI技术什么时候能突破阈值,也能有新的应用场景。同理,我们正在打造的大模型也在谋求在虚拟人方面的阈值突破,预计一年后能在虚拟人的场景交互上取得进展。”

除了ChatGPT浪潮,成维忠也一直关注苹果眼镜。“苹果的AR眼镜能否走的长远,除了看技术上能不能融合AR和VR,更重要的是商业模式上,能否和开发者分钱,这样才能吸引开发者入场,共创生态。”

“随着AR 眼镜的发展,内容表现方式也会发生改变,这也会给做3D内容生成与虚拟人的公司带来更大的机会,是属于创业者的好机会。”

谈及苹果眼镜,梅嵩认为VR和元宇宙最好的落地场景前期都在游戏中。“为什么 VR 的渗透率、用户数没有起来,核心原因是没有基于VR的好内容。”

云舶投入了三千万元来打造小K直播姬中的3D资产,“一方面是成本,另一方面我们有小K视频引擎等自研的技术做了6年,这才形成了我们自己的护城河。”

“下半年,我们会启动AIGC多模态转换的产品开发,比如AI音乐、AI语音;小K直播姬会推出单摄全身动捕版本;也会产品融入到游戏动画制作流程中,帮助使用者生成可使用的动画数据;此外,也会推出小K绘图的电商版、游戏版。”

这些规划当然也需要大模型的支持,因此云舶接下来也会采用大量数据来训练模型,公司已经拥有数十人的标注团队。

伏英娜也用升级换代的说法来形容AR/VR普及后的情景。“第一代互联网,是每个企业都有自己的网站。第二代互联网是每个企业都有APP。第三代互联网将是四维时空的体验,会升级到3D内容智能生成,把时间和空间折叠,实现实时智能互动。3D内容可以用H5的方式轻量化输出,而且可以同时出现在网页、客户端等任何地方实时交互。”

苹果头显降临,AI虚拟人的救星还是流星?

迈吉客科技最新打造的“数智空间站”,为企业在虚拟空间建立“数字名片”,能立体化、视觉化、智能化呈现,超越现实物理时空局限,给用户提供一对一、千人千面的个性化智能服务。这种内容运营可以通过私有化部署或SaaS实现。这是构建新一代内容生产力和沉浸式体验的关键,也是数字经济时代重要的工具及平台。

AIGC技术在不断革新行业认知的同时,也给虚拟人技术带来一场革命。对虚拟人技术从业者来说,由ChatGPT引发的AI热潮,加上AR/VR的新热点,产生了双倍的兴奋。

当看到的新鲜事太多,想做的事情也太多的时候,如何使用AI帮忙生成无穷无尽的内容消费品,打开通往新世界的大门,恐怕是技术提供商和B端客户们需要共同解决的问题。

以上是苹果头显降临,AI虚拟人的救星还是流星?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
10 GPT-4O图像生成会提示今天尝试!10 GPT-4O图像生成会提示今天尝试!Apr 24, 2025 am 10:26 AM

AI世界中发生了绝对野生的事情。 Openai的本地形象生成现在很疯狂。我们正在谈论令人jaw目结舌的视觉效果,可怕的细节和抛光的输出

用帆板编码的氛围指南用帆板编码的氛围指南Apr 24, 2025 am 10:25 AM

毫不费力地将您的编码愿景带入Codeium's Windsurf,这是您的AI驱动的编码伴侣。 Windsurf简化了整个软件开发生命周期,从编码和调试到优化,将过程转换为INTU

使用RMGB v2.0探索图像背景删除使用RMGB v2.0探索图像背景删除Apr 24, 2025 am 10:20 AM

Braiai的RMGB v2.0:强大的开源背景拆卸模型 图像分割模型正在彻底改变各个领域,而背景删除是进步的关键领域。 Braiai的RMGB v2.0是最先进的开源M

评估大语模型中的毒性评估大语模型中的毒性Apr 24, 2025 am 10:14 AM

本文探讨了大语言模型(LLM)中的毒性至关重要问题以及用于评估和减轻它的方法。 LLM,为从聊天机器人到内容生成的各种应用程序提供动力,需要强大的评估指标,机智

Rag Reranker的综合指南Rag Reranker的综合指南Apr 24, 2025 am 10:10 AM

检索增强发电(RAG)系统正在改变信息访问,但其有效性取决于检索到的数据的质量。 这是重读者变得至关重要的地方 - 充当搜索结果的质量过滤器,以确保仅确保

如何使用Gemma 3&Docling构建多模式抹布?如何使用Gemma 3&Docling构建多模式抹布?Apr 24, 2025 am 10:04 AM

该教程通过在Google Colab中构建精致的多式联运检索一代(RAG)管道来指导您。 我们将使用Gemma 3(用于语言和视觉),文档(文档转换),Langchain等尖端工具

可扩展AI和机器学习应用的射线指南可扩展AI和机器学习应用的射线指南Apr 24, 2025 am 10:01 AM

雷:扩展AI和Python应用程序的有力框架 Ray是一个革命性的开源框架,旨在轻松扩展AI和Python应用程序。 它的直观API使研究人员和开发人员可以通过其代码过渡

如何将OpenAI MCP集成用于建筑代理?如何将OpenAI MCP集成用于建筑代理?Apr 24, 2025 am 09:58 AM

OpenAI通过支持人类的模型上下文协议(MCP)来涵盖互操作性,这是一种开源标准,简化了与不同数据系统的AI助手集成。这项合作为AI应用程序奠定了一个统一的框架

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),