文/James
手机的出现让相机被颠覆,移动支付则取代了钱包……很多时候,对现有行业造成冲击,甚至将其彻底颠覆的,并不是来自同行业的竞争者,而是来自跨行业的“降维打击”
或许搜索引擎就是这样的
在今年年初,微软的必应搜索率先引入了大型语言模型,并提供了基于GPT-4的聊天界面,使其在市场份额和影响力方面一跃而出,成为谷歌无法忽视的竞争对手。尽管谷歌在人工智能研发方面一直处于行业前沿,但由于其搜索业务是其主要的收入来源,因此对于自身革新的态度相对保守
在中国,昆仑万维是众所周知的游戏开发和运营公司,他们在行业中率先推出了人工智能搜索引擎,这个搜索引擎的完成度相当高,足以给国内现有的搜索产品带来一种“跨界”的竞争压力
基于自研的天工大模型,昆仑万维已经推出了3款主要的C端产品,即AI对话、AI搜索和AI创作。这家公司还因对全球化和内容创作的前瞻性思考而引人关注。9月初,计算机视觉和机器学习领域的国际顶级专家颜水成教授加盟,而公司自主研发的一款AI UGC游戏平台Club Koala 也即将上市。
近日,娱乐资本论·视智未来专访昆仑万维董事长兼CEO方汉,深入探讨了公司在AI方面的最新动向及未来愿景。
天工AI工具:AIGC不是都要做成聊天
短时间试用天工AI搜索,就可以给人留下深刻的印象。
在首批8款国产大模型通过备案之际,娱乐资本论·视智未来刚刚进行了第二次国产大模型横向评测,在其中可以看到天工AI搜索在特定内容生成任务方面有出色的表现。
方汉解释说,昆仑万维的团队在搜索领域的经验积累比表面上看起来要长。团队花了六年的时间在搜索领域积累,然后逐渐将其整合成一个产品。
6年前,昆仑万维旗下一款名为"Opera News"的新闻推荐产品上线运营。这是一款主要面向海外市场的信息流产品,它汇集了几十个国家的几十万个网站上的信息处理与推送。这个过程实质上就是一个小型的搜索引擎。目前对重点网站的抓取频率已经提升到每分钟一次。
在过去的六年里,昆仑万维的技术团队已经积累了丰富的预训练数据收集、清洗和深度加工的能力。他们还在研究如何确保信息的真实性,例如对各种信息源网站进行评分。对于如何进行信息推送、如何调整内容以适应国内用户以及如何避免信息孤立等问题,团队已经积累了经验和应对策略
昆仑天工AI搜索的诞生是由于引入了两个千亿级别的模型,分别是千亿预训练基座模型和千亿 RLHF(Reinforcement Learning from Human Feedback)模型底座
方汉提到了一些有趣的用户案例,其中包括一个公务员写工作总结,以及使用AI搜索来学习如何给老师写检讨。这些案例让他意识到产品的应用场景更加广泛
天工AI搜索未来还将提供图片搜索、图片理解等功能。这些AI工具可能会通过广告来获得收入,但方汉认为,广告并不是最主要的盈利模式
除了AI搜索,天工还包括AI对话、AI创作产品。娱乐资本论·视智未来测试了同一个写作任务“西湖有哪些美食”,在天工三款不同产品中提问后各自的表现。
天工AI对话的结果相对简明,而天工AI创作的内容会更丰富,天工AI搜索则可能会加入一些其他平台如知乎专栏的内容,引用的内容均有明确来源
(天工AI对话)
(天工AI创作)
(天工AI搜索)
天工AI搜索、天工AI对话、天工AI创作分别属于三个独立的界面,而不像其他同类产品那样集成在一个统一的聊天窗口中。这样设计的原因是方汉观察到,大多数用户并不会编写prompt,需要适当的引导。很多用户容易在对话界面中沉迷于“调戏AI”。改为搜索框后,用户输入的指令更加实用
方汉得出的一个结论是,普通用户更需要的是“生成端到端的内容”,直接得到的就是成品,而不是提供给他们一个工具,先做出半成品再调整。这中间的转化过程,需要“包装起来”。 重新写作: 方汉得出的一个结论是,普通用户更需要的是直接获得成品的“生成端到端的内容”,而不是提供给他们一个工具,让他们先制作半成品再进行调整。这个转化过程需要进行“包装”
因此,天工团队计划推出一款一键生成漫画、动画或短视频的工具作为他们的“下一个大招”。他们投入了大量的时间和精力,研究如何将剧本转化为分镜,然后再转化为漫画。这样一来,将来转换为AI动画就会更加自然顺畅
这类产品将首先在海外市场推出。方汉认为,海外的游戏玩家对内容不够准确问题的包容度较高,也比较期待具有创意和惊喜的输出结果。它们一开始就支持英、日、韩文,计划未来支持泰语、印地语等。
AI游戏:自由世界和数字陪伴
不过,接下来要讨论的人工智能应用将会比前面提到的几种更加突破人们对人工智能的常规印象
8月25日,昆仑万维旗下的游戏工作室Play for Fun 在德国科隆展上展示了他们自主研发的AI UGC游戏平台Club Koala,这是中国首款进军国际市场的AI游戏
昆仑万维在海外市场运营了近20年,因此在国内游戏出海方面拥有相当的话语权。方汉认为,其中一个经验是在开发过程中更注重做“平台”而不是“剧情”。中国公司在工具和平台的开发方面相对擅长,并且可以避免第一方内容开发可能带来的潜在文化冲突
Club Koala是一个轻剧情的,自由世界方向的游戏,这实质上是一个UGC平台,提供工具,让用户自由创作,也符合他们对海外市场一贯的主要策略。
这款游戏几乎所有的元素,从NPC对话到衣服、家具、小游戏以及剧本等,都可以通过AI驱动来随机生成,或者由玩家自行创作。在捏道具的过程中,玩家甚至可以通过“动动嘴”的方式来创作内容,而不需要像以往那样手动调节甚至编写代码
Club Koala的目标是将人工智能应用于内容创作的整个过程中,以便让用户更轻松地创作内容并形成社区文化。方汉认为,尽管大部分用户创作的内容可能质量不高,但只要有一定比例的内容具备销售价值,就能够形成市场
AI NPC角色是Club Koala的另一个大胆创新。每个玩家都可以创建一个专属的陪伴角色,这个角色有自己的记忆、生涯,并且拥有海量的问题库,可以解答玩家的开放性问题。 AI NPC角色是Club Koala的另一个大胆创新。每个玩家都可以创建一个专属的陪伴角色,这个角色有自己的记忆、生涯,并且拥有海量的问题库,可以解答玩家的开放性问题
在多轮对话方面,目前在一些测试中已经接近Character.ai和Replika的效果。通过利用大型模型和工程能力来实现多轮对话的记忆,创造了一个类似于人类长时记忆和短时记忆的数据库
这个数据库通过大量的标签来组织向量数据。在对话中,会先定位标签,再细致分析解答,以提升响应速度。他们还会根据角色的性格等因素,对重要或不重要的记忆打权重和排序。最后,针对闲聊等场合还有一些专用的小模型。综合运用这些方法,它们规避了多次使用大模型的算力消耗。
花这么大力气设计一个游戏内的NPC,绝不是为了炫技这么简单。在方汉的规划中,这个AI驱动的数字陪伴项目,具有游戏之外的社会价值。
在Club Koala上市之初,首要任务是让用户愿意与NPC聊天;在测试顺利后,同一个角色将有希望登陆昆仑万维的其他游戏,甚至在其它非游戏产品和界面上也可以继续存在,成为一个全时陪伴的角色。从这个角度上讲,AI NPC是一个可以在所有游戏中使用的底座,而他们正在这个底座上进行实验。
方汉提到,AI游戏是一个全新的项目,对原有组织结构产生了影响。他们将整个工作室全面转向平台和产品,这个转型过程相对比较顺利,而员工们也对做AI游戏万分期待。
大型B端应用与芯片版图相结合的重要性
昆仑万维早前宣布与蜜莱坞科技(映客的母公司)达成了一项价值千万以上的合作。他们的人工智能技术可以帮助主播们为他们的“前几万个用户”提供更加个性化的聊天服务。方汉表示,映客选择使用昆仑天工是因为它在多轮对话和情感对话方面的效果更好
在这个项目中,天工会筛选优质主播的语料,帮助客户训练有代表性的主播角色,再结合主播形象、口头禅等信息加入提示词,让模型进行“角色扮演”。其中的挑战在于语料清洗和小样本学习。产品的最终形态则留待客户自己开发。
那么,天工在其他领域是否也找到了重要客户?方汉表示,天工B端主要专注于人力资源、金融和医药领域等。昆仑万维的关联企业,如海外移动支付项目OPay和科亚医疗,都有植入人工智能的潜力。目前,天工已经与一些人力资源公司达成合作协议,具体细节将在后续公布
他相信相对于其他模型开发商,他在大型模型的训练和微调方面拥有三年的经验,每两周进行一次迭代,使其具有独特性,并且底层更加可控。他的产品能力和长远思维有助于打造可复用的SaaS产品,而不是只做一次性的“施工队”
昆仑万维具有跨国游戏和应用开发商的C端基因,使得他们对C端的发展路径更加熟悉。同时,他们还会通过投资来布局一些C端公司。此外,他们还投资于新材料、芯片等领域
9月20日,昆仑万维官宣投资并控股AI算力芯片企业艾捷科芯,完成AGI与AIGC全产业链布局。艾捷科芯主要从事AI大算力及配套芯片的研发生产,特别聚焦于生成式AI的智能计算。核心团队由芯片研发、集成电路、人工智能、大语言模型等领域的知名专家学者组成。
全球化策略是昆仑万维的醒目标签。公司的海外收入长久以来稳定占比50%以上,最新财报数据显示占比更是高达83%。除了游戏,Opera浏览器是公司全球化的另一个经典案例,它的总部在挪威,但大部分研发在波兰进行。在Opera News等成熟业务基础上,适配AI的全新浏览器Opera One,人工智能服务Aria等创新不断涌现,目前Opera的全球平均月活用户近4亿。
近期,颜水成教授加入昆仑万维,这一消息引起了广泛的关注。作为计算机视觉和机器学习领域的国际顶级专家,他曾表示,昆仑万维的务实态度、长期主义视角以及建立国际化大模型团队的愿景都吸引了他的注意
随着颜教授的加入,昆仑万维公司的"2050全球研究院"开始运作,计划在新加坡、伦敦和硅谷设立研究中心,以吸引更多的海外人才。这将使公司在基础大模型领域投入更多资源,并积极参与开源社区的贡献
这些前瞻性的思考和布局,是否能让昆仑万维比大多数人更早地看到未来呢?
方汉多年来一直对人工智能技术的发展保持关注,最近一年多来,几乎每天都在阅读与人工智能相关的论文。他认为,当前的人工智能趋势是由技术驱动的,甚至可以说是由论文推动的,而不是由产品驱动的,这是因为技术仍在快速变化中
在提及大模型之后,下一个“大事件”是方汉将票投给了多模态,尤其是视频生成。他认为视频生成是“内容工业皇冠上的明珠”。一旦解决了视频生成中的一致性和画风等问题,整个影视行业将会被彻底重塑,甚至有人怀疑未来是否还需要摄像机存在
以上是谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业的详细内容。更多信息请关注PHP中文网其他相关文章!