首頁  >  文章  >  科技週邊  >  Siri越來越“大眾”,未來智慧語音會有哪些突破?

Siri越來越“大眾”,未來智慧語音會有哪些突破?

王林
王林轉載
2023-05-06 13:07:061108瀏覽

對於人機互動來說,如何讓機器具備良好的聽覺,一直是近年來 AI 領域不懈追求的目標。 2009 年前後,深度學習模型用於開始走出學術界,而以語音喚醒、識別、增強和合成為代表的智慧語音技術,也逐漸走向成熟。

一個早期的典型例子是,2011 年 siri 的誕生。智慧語音成了人與機器之間的溝通互動方式的新躍遷。而後經過十餘年的發展,"嘿,siri"式的人機問答已經不再局限於移動終端設備,走進千家萬戶,廣泛應用於各個場景:家居陪伴智能音箱,方便網購的天貓精靈,會議上的同聲翻譯,出行時的車載語音導航助理等等。

隨著越來越多的網路企業及上游廠商在智慧語音賽道的積極佈局,智慧語音客服、對話式AI 應用、AI 虛擬助理等產品的取得了進一步品質提升,回應語音更自然,理解問題更準確,並且有了自己的"小情緒"。

身處數位化浪潮的時代,萬物互聯的趨勢不可阻擋。而智慧語音作為當下人機互動的關鍵接口,正處於與實體經濟深度融合碰撞的時期。隨著應用場景的進一步下沉和拓展,我們也看到不少挑戰性的問題,例如:如何識別說話者身分、如何辨識方言、如何消除歧義等等都是最新的研究熱點。

一項技術走向成熟的背後,往往蘊含著一些潛性,這其中包括它在實際應用中的創新能力,以及它更有潛力的演進方向。展望下一個階段,智慧語音技術也必會出現新的演進趨勢,例如:深度整合的AI語音晶片能否取代雲端運行模型的模式?多模態融合、無監督學習、腦學科交叉融合的創新研究能否有突破性成果?我們拭目以待。

那麼,智慧語音技術在各大企業中實踐探索中都遇到了哪些真實的生產問題?又是如何解決的?取得了哪些進展?產業出現了哪些新變化?下一步的發展趨勢又會有哪些? "AISummit全球人工智慧技術大會"智慧語音技術專場帶給你深度思考!

8月7日,51CTO傾力打造的「AISummit全球人工智慧技術大會」智慧語音專場重磅來襲!

專場有哪些你感興趣的專題內容?

專題一:作業幫語音技術實踐

1.語音辨識技術探索:分享端對端、高效利用資料等大規模實際應用場景下的語音辨識技術,並提出了基於前綴自動機的熱詞技術方案。

2.語音評測技術實踐:語音發音糾錯技術方面結合作業幫的高並發場景,提出了多任務知識遷移、多模態特徵融融合方案,很大程度上提升提升模型的因素區分能力與雜訊環境下的檢錯能力。並針對語音評測落地難的痛點,提出了高效能的雲端一體化評測技術。

3.語音合成技術框架:分享作業幫基於現有的小數據量語音技術框架進一步改進的思考與實踐。

專題二:位元組語音辨識技術在飛書中的應用

#1.語音辨識技術在辦公室場景中的應用程式:辦公室郵件、即時通訊中的語音輸入辦公室語音助理、即時字幕&會後轉寫。

2.解決思考:會議智慧化、效率提升。

3.挑戰與機會:語音辨識任務的挑戰、下游任務帶來的挑戰、會議提供額外的資訊。

4.重點演算法工作介紹(端對端語音辨識系統):Transducer & CIF、動態 靜態熱詞、Context-aware。

專題三:建構高水準的語音合成系統實務

1.高水準語音合成系統背景介紹及問題分析。

2.高水準語音合成系統設計思考與實現。

3.實驗評估。

4.未來工作展望。

專題四:SOUL社交場景下的智慧語音技術實踐之路

1.SOUL社交元宇宙場景下的端對端語音辨識

2.多模態語音合成技術的建構路線

3.在語音安全與語音互動等業務情境下的應用

##專題五:端對端語音辨識技術在58同城的探索實踐

1.語音辨識在58同城的應用場景:AI智慧語音應用、語音辨識連結介紹、挑戰與技術路線

2.基於WeNet的模型最佳化工作:半監督訓練、Efficient Conformer、模型壓縮

3.端對端語音辨識的部署方案:自研引擎架構、Wenet解碼服務部署、串流/非串流解碼效能測試

都有哪些重量級嘉賓?

一、宋暘,作業幫首席演算法專家、智能中台負責人、專場出品人

宋暘在百度工作7年,從事演算法研發工作。 2015年加入作業幫,為智能中台部負責人,為公司各業務輸出包括資料探勘、NLP、語音在內的中台技術能力,先後負責搜尋答疑、個人化推薦、智慧質檢、語音評測、服務智能化調度等方向。

二、王強強,作業幫語音技術團隊負責人

在加入作業幫之前,王強強曾任職於清華大學電子工程系語音處理與機器智慧實驗室,負責語音辨識演算法落地,建構工業級解決方案。 2018 年加入作業幫,負責語音相關演算法研究與落地,主導了語音辨識、評測、合成等演算法在作業幫的落地實踐, 為公司提供整套語音技術解決方案。

三、張駿,位元組跳動AI Lab語音辨識演算法研究員

張駿長期從事語音辨識、語音喚醒等語音演算法研究與應用,經驗豐富。 2018 年加入位元組跳動AI Lab智慧語音團隊,目前主要負責智慧辦公室、智慧硬體、智慧客服等方向的語音技術方案建置。

四、譚旭,微軟亞洲研究院主管研究員

譚旭,研究領域包括深度學習、自然語言/語音/音樂、AI內容生成等。研發的機器翻譯和語音合成系統獲得多項比賽冠軍並在學術評測集上達到人類水平,研究工作如預訓練語言模型MASS、語音合成模型FastSpeech/NaturalSpeech、AI音樂項目Muzic受到業界廣泛關注。

五、劉忠亮,SOUL語音演算法負責人

劉忠亮碩士畢業於中科院研究生院,目前在SOUL擔任語音演算法負責人,曾任職於搜狗AI交互部和陌陌大數據部。近10年主要從事語音喚醒、語音辨識、語音合成、音訊音樂理解等語音技術體系的研發工作,主要應用於輸入法、手機助理、智慧硬體、語音安全等語音互動及語音理解業務場景,致力於打造最好的可落地的語音技術。

六、週維,58同城AI Lab語音演算法部負責人、演算法架構師

週維,58同城AI Lab語音演算法部負責人、演算法架構師,負責語音辨識、語音合成演算法研發。 2016年碩士畢業於中國科學院大學,畢業後參與對話式AI產品方向創業,2018年5月加入58同城,曾先後參與智慧客服、智慧外呼、智慧寫稿等AI計畫的NLP演算法研發,2019年開始主攻語音演算法方向,帶領團隊從0到1自主研發58同城語音處理引擎中的語音演算法。

還有哪些精彩活動?

除了精彩的AI技術大咖的精彩的實踐創新乾貨分享外,AISummit全球人工智慧技術大會還為與會的朋友們準備了豐富的場前、場中互動福利。加入這場盛會,在拓展技術能力和人脈資源的同時,順便驚喜禮品帶回家!

活動包括"當人不讓"、"工享幸運"、"智同道合"等四大妙趣橫生的互動遊戲,總有一款精美禮品驚艷到你!那麼,傳說中神秘的終極大獎會是什麼呢?等待熱愛科技的你來現場揭秘! (PS:聽說越早預約報名,中大獎幾率越高哦!)

Siri越來越“大眾”,未來智慧語音會有哪些突破?

怎麼快速預約報名?

點擊進入進入##AISummit 全球人工智慧技術大會 官方網站,按提示完整填寫、提交資訊即可完成報名。

掃碼加入大會官方群,參與抽獎,贏取SONY音響、冰墩墩、AI技術書籍等精美禮品,還有紅包雨掉落。

Siri越來越“大眾”,未來智慧語音會有哪些突破?

Siri越來越“大眾”,未來智慧語音會有哪些突破?

以上是Siri越來越“大眾”,未來智慧語音會有哪些突破?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除