搜尋
首頁科技週邊人工智慧爆火的生成式AI,能讓智慧音箱起死回生嗎?

爆火的生成式AI,能讓智慧音箱起死回生嗎?

Jun 06, 2023 am 08:05 AM
生成式ai智慧音箱爆火。

智慧音箱這類如今幾乎已經被大量消費者遺忘的產品,在先前經歷了2017年、2018年的「瘋狂」之後,早已不再是大多數消費者關注的對象。就在大家以為智慧音箱會曇花一現時,ChatGPT的橫空出世似乎讓智慧音箱有了煥發第二春的可能,也給了這個在走下坡路的行業一個新的機會。那麼,智慧音箱與現今爆紅的生成式AI能擦出火花嗎?

爆火的生成式AI,能讓智慧音箱起死回生嗎?

生成式AI之於智慧音箱產業,或許就是久旱逢甘霖。根據相關市場調查數據顯示,2023年第一季度,受產品同質化嚴重和消費者需求下降等因素的疊加影響,國內智慧音箱在線上的監測零售量為157萬台、再次下跌40.6%,而在整個2022年,智慧音箱國內全通路銷量為2,631萬台、年減了28%。

為什麼曾經被各大巨頭寄予厚望、甚至被視為可能是智能家庭入口的智能音箱,會在近年來滑入深淵呢?原因其實只有一個,就是智慧音箱真的不夠聰明。

在智慧音箱這概念火爆的2017年,業界曾有關於智慧音箱的重心到底應該在「智慧」還是「音質」上的討論。最終,騰訊聽聽、蘋果HomePod等一系列注重音質的產品,用它們的慘烈失敗證明智慧音箱的賣點只有可能是智慧化。

爆火的生成式AI,能讓智慧音箱起死回生嗎?

然而遺憾的是,絕大多數智慧音箱的智慧化程度只能​​用「捉襟見肘」來形容,而各大廠商對於ASR(語音辨識)、NLP自然語意處理、遠場拾音等人工智慧和聲學技術的進步,又實在有些過於樂觀。其實智慧音箱從技術層面來說很簡單,它的工作模式就是收集使用者的聲音,然後將音訊傳送到伺服器、再計算並產出結果,最終將結果傳送到智慧音箱上變成具體的行為,例如打開某個應用程式或是回覆用戶的提問。

沒錯,智慧音箱本身其實與人工智慧並不沾邊,小愛同學、小度、天貓精靈的真身藏在了相應的伺服器端上。這一切也導致了決定智慧音箱使用體驗的關鍵是遠場拾音技術,也就是在複雜的聲學環境下準確捕捉用戶語音指令的能力,畢竟總不能出現用戶說“講個笑話”,智能音箱聽成「放首歌」了吧。

爆火的生成式AI,能讓智慧音箱起死回生嗎?

智慧音箱的解決方案,則是使用大規模麥克風陣列來收集聲音,但其中卻有一個痛點一直得不到解決,那就是語音喚醒(keyword spotting)。大家在使用智慧音箱時,需要用到諸如「Hi,Siri」、「小愛同學」、「小度小度」這樣的喚醒詞,讓智慧音箱知道你在跟它說話,這也就意味著智能音箱缺乏主動服務的能力。更重要的是,由於技術的限制,智慧音箱長期以來只能理解簡單的指令,例如「音量調大一點/調小一點」、「播放某某人的某某歌」等,再複雜一些的語句辨識起來往往就很難。

而ChatGPT、文心一言這類生成式AI之於智慧音箱的意義,就是前者可以幫助智慧音箱理解更複雜的語句,並提供更自然的溝通。相信使用過微軟Bing Chat、百度文心一言或ChatGPT的朋友應該就知道,在與這類生成式AI對話時,並不需要用諸如“Hi,ChatGPT”這樣的開場白,直接輸入內容即可開始對話進程。

爆火的生成式AI,能讓智慧音箱起死回生嗎?

由於生成式AI是在基於大規模語言模型(LLM,Large Language Model)的基礎上,加入了人工標註數據和從人類反饋中進行強化學習技術,再輔以知識圖譜技術,即一種將知識寫成結構化三元組(包含實體、概念和關係)的多關係圖,讓AI得以理解人類指令的意義,並最終從龐大的資訊資料庫中選擇內容來回答。

ChatGPT這類產品比起Siri、小愛同學最大的變化,就是有了多輪對話的能力。相比Siri幾乎是“魚的記憶”,ChatGPT可以一直與用戶對話,再加上對於情緒更清晰的感知,讓用戶以為真的是在與活生生的人對話。對於一個消費級產品而言,使用者顯然並不在乎背後的技術原理有多高深,而是關注它能否解決問題或滿足需求。

爆火的生成式AI,能讓智慧音箱起死回生嗎?

生成式AI的魅力就在於它的能力上限很高,其中典型的例子就是微軟的Microsoft Copilot,同時它還能在某種程度上滿足用戶的社交需求,如今在海外已有創作者藉助ChatGPT ,推出了以自己為模型的“虛擬伴侶”,並收穫了超過1000名用戶。總的來說,將生成式AI與智慧音箱結合幾乎能補足後者的短板,使得其在消費級賽道擁有了可堪一用的智慧化水準。

事實上,部分智慧音箱廠商已經行動起來了。例如今年2月,百度在預熱文心一言時,小度就已宣布將融合文心一言,打造針對智慧型裝置場景的AI模型「小度靈機」;4月天貓精靈接入「鳥鳥分鳥」模型打造的“AI嘴替”,同時宣佈接入阿里巴巴的通義千問。

爆火的生成式AI,能讓智慧音箱起死回生嗎?

但要指出的是,生成式AI並非「萬靈藥」。就目前來說,一切生成式AI都面臨著一個不可避免的問題,那就是算力資源的稀缺。最近生成式AI天花板GPT-4「變笨」的消息引發了許多關注,相較於剛發佈時的狀態,如今GPT-4的文字程式碼品質全方位下降已然成為了用戶的共識。

沒錯,其實不只是GPT-4,像是ChatGPT、文心一言等面向大眾的這類產品都出現了類似的情況,使用者量的增加導致了大模型表現的下降。

現在生成式AI領域面臨的核心問題,就是算力資源緊張、無法應付洶湧而來的用戶,而為了確保用戶體驗,這類產品就只能降低大模型的效能、減少生成內容的時間來給伺服器「減負」。相較之下,智慧音箱的存量市場規模無疑更加龐大,所以在接取生成式AI後,幾乎不可避免地會遇到類似的問題。

爆火的生成式AI,能讓智慧音箱起死回生嗎?

未來很有可能會出現的情況,是智慧音箱的智慧化水平呈現出一條拋物線,初期用戶體驗會跨越式提升,但隨著用戶規模的不斷增加,智能化表現反而可能會“退化”回數年前的水平。

以上是爆火的生成式AI,能讓智慧音箱起死回生嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境