搜索
首页科技周边人工智能爆火的生成式AI,能让智能音箱起死回生吗?

爆火的生成式AI,能让智能音箱起死回生吗?

Jun 06, 2023 am 08:05 AM
生成式ai智能音箱爆火。

智能音箱这类如今几乎已经被大量消费者遗忘的产品,在此前经历了2017年、2018年的“疯狂”之后,早已不再是大多数消费者关注的对象。就在大家以为智能音箱会昙花一现时,ChatGPT的横空出世似乎让智能音箱有了焕发第二春的可能,也给了这个在走下坡路的行业一个新的机遇。那么,智能音箱与如今爆红的生成式AI能擦出火花吗?

爆火的生成式AI,能让智能音箱起死回生吗?

生成式AI之于智能音箱行业,或许就是久旱逢甘霖。根据相关市场调查数据显示,2023年第一季度,受产品同质化严重和消费者需求下降等因素的叠加影响,国内智能音箱在线上的监测零售量为157万台、再次下跌40.6%,而在整个2022年,智能音箱国内全渠道销量为2631万台、同比下降了28%。

为什么曾经被各大巨头寄予厚望、甚至被视为可能是智能家庭入口的智能音箱,会在近年来滑入深渊呢?原因其实只有一个,那就是智能音箱真的不够智能。

在智能音箱这一概念火热的2017年,业界曾有关于智能音箱的重心到底应该在“智能”、还是“音质”上的讨论。最终,腾讯听听、苹果HomePod等一系列注重音质的产品,用它们的惨烈失败证明智能音箱的卖点只有可能是智能化。

爆火的生成式AI,能让智能音箱起死回生吗?

然而遗憾的是,绝大多数智能音箱的智能化程度只能用“捉襟见肘”来形容,而各大厂商对于ASR(语音识别)、NLP自然语义处理、远场拾音等人工智能和声学技术的进步,又实在有些过于乐观。其实智能音箱从技术层面来说很简单,它的工作模式就是收集用户的声音,然后将音频发到服务器上、再计算并产出结果,最终将结果发送到智能音箱上变成具体的行为,比如打开某个应用或是回复用户的提问。

没错,智能音箱本身其实与人工智能并不沾边,小爱同学、小度、天猫精灵的真身藏在了相应的服务器端上。这一切也导致了决定智能音箱使用体验的关键是远场拾音技术,也就是在复杂的声学环境下准确捕捉用户语音指令的能力,毕竟总不能出现用户说“讲个笑话”,智能音箱听成“放首歌”了吧。

爆火的生成式AI,能让智能音箱起死回生吗?

智能音箱的解决方案,则是使用大规模麦克风阵列来收集声音,但其中却有一个痛点一直得不到解决,那就是语音唤醒(keyword spotting)。大家在使用智能音箱时,需要用到诸如“Hi,Siri”、“小爱同学”、“小度小度”这样的唤醒词,让智能音箱知道你在和它说话,这也就意味着智能音箱缺乏主动服务的能力。更为重要的是,由于技术的限制,智能音箱长期以来只能理解简单的指令,比如“音量调大一点/调小一点”、“播放某某人的某某歌”等,再复杂一些的语句识别起来往往就很难。

而ChatGPT、文心一言这类生成式AI之于智能音箱的意义,就是前者可以帮助智能音箱理解更加复杂的语句,并提供更加自然的交流。相信使用过微软Bing Chat、百度文心一言或ChatGPT的朋友应该就知道,在与这类生成式AI对话时,并不需要用诸如“Hi,ChatGPT”这样的开场白,直接输入内容即可开始对话进程。

爆火的生成式AI,能让智能音箱起死回生吗?

由于生成式AI是在基于大规模语言模型(LLM,Large Language Model)的基础上,加入了人工标注数据和从人类反馈中进行强化学习技术,再辅以知识图谱技术,即一种将知识写成结构化三元组(包含实体、概念和关系)的多关系图,让AI得以理解人类指令的含义,并最终从庞大的信息数据库中选择内容进行回答。

ChatGPT这类产品相比于Siri、小爱同学最大的变化,就是有了多轮对话的能力。相比Siri几乎是“鱼的记忆”,ChatGPT则可以一直与用户对话,再加上对于情绪更清晰的感知,让用户以为真的是在与活生生的人对话。对于一个消费级产品而言,用户显然并不在乎背后的技术原理有多么高深,而是关注它能否解决问题或是满足需求。

爆火的生成式AI,能让智能音箱起死回生吗?

生成式AI的魅力就在于它的能力上限很高,其中典型的例子就是微软的Microsoft Copilot,同时它还能在一定程度上满足用户的社交需求,如今在海外已有创作者借助ChatGPT,推出了以自己为模型的“虚拟伴侣”,并收获了超过1000名用户。总的来说,将生成式AI与智能音箱结合几乎能补足后者的短板,使得其在消费级赛道拥有了可堪一用的智能化水平。

事实上,部分智能音箱厂商已经行动起来了。例如今年2月,百度在预热文心一言时,小度就已宣布将融合文心一言,打造针对智能设备场景的AI模型“小度灵机”;4月天猫精灵接入“鸟鸟分鸟”模型打造的“AI嘴替”,同时宣布接入阿里巴巴的通义千问。

爆火的生成式AI,能让智能音箱起死回生吗?

但需要指出的是,生成式AI并非“万能灵药”。就目前来说,一切生成式AI都面临着一个不可避免的问题,那就是算力资源的稀缺。最近生成式AI天花板GPT-4“变笨”的消息引发了诸多关注,相比于刚刚发布时的状态,如今GPT-4的文本代码质量全方位下降已然成为了用户的共识。

没错,其实不仅是GPT-4,诸如ChatGPT、文心一言等面向公众的这类产品都出现了类似的情况,用户量的增加导致了大模型性能的下降。

现在生成式AI领域面临的核心问题,就是算力资源紧张、无法应对汹涌而来的用户,而为了确保用户体验,这类产品就只能降低大模型的性能、减少生成内容的时间来给服务器“减负”。相较之下,智能音箱的存量市场规模无疑更加庞大,所以在接入生成式AI后,几乎不可避免地会遇到类似的问题。

爆火的生成式AI,能让智能音箱起死回生吗?

未来很有可能会出现的情况,是智能音箱的智能化水平呈现出一条抛物线,初期用户体验会跨越式提升,但随着用户规模的不断增加,智能化表现反而可能会“退化”回数年前的水平。

以上是爆火的生成式AI,能让智能音箱起死回生吗?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?Apr 23, 2025 am 11:49 AM

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

4个新的双子座功能您可以错过4个新的双子座功能您可以错过Apr 23, 2025 am 11:48 AM

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

Camunda为经纪人AI编排编写了新的分数Camunda为经纪人AI编排编写了新的分数Apr 23, 2025 am 11:46 AM

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

策划的企业AI体验是否有价值?策划的企业AI体验是否有价值?Apr 23, 2025 am 11:45 AM

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

如何为抹布找到最佳的多语言嵌入模型?如何为抹布找到最佳的多语言嵌入模型?Apr 23, 2025 am 11:44 AM

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

麝香:奥斯汀的机器人需要每10,000英里进行干预麝香:奥斯汀的机器人需要每10,000英里进行干预Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

AI震惊的枢轴:从工作工具到数字治疗师和生活教练AI震惊的枢轴:从工作工具到数字治疗师和生活教练Apr 23, 2025 am 11:41 AM

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将

公司竞争AI代理的采用公司竞争AI代理的采用Apr 23, 2025 am 11:40 AM

AI代理商的兴起正在改变业务格局。 与云革命相比,预计AI代理的影响呈指数增长,有望彻底改变知识工作。 模拟人类决策的能力

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),