美國康乃爾大學的研究人員開發了一種新技術,可以透過聲納眼鏡進行無聲溝通。這種眼鏡利用微型揚聲器和麥克風來讀取佩戴者默念的單詞,從而可以在不需要物理輸入的情況下執行各種任務。
這項技術由康乃爾大學的博士生張瑞東(音譯)領導開發,是在一個類似的計畫的基礎上進行的改進,該計畫使用了一個無線耳機,而之前的模型則依賴攝影機。
據IT之家了解,該聲納眼鏡使用一種名為 EchoSpeech 的無聲語音識別接口,利用聲納來感知嘴部運動,同時使用一個深度學習算法實時分析回波特徵。這使得系統能夠以約 95% 的準確率識別佩戴者默念的單字。
這項技術最令人興奮的前景之一是,對於有語言障礙的人來說,可以使用它來無聲地將對話輸入到語音合成器中,然後將單字大聲說出來。眼鏡也可以用來在安靜的圖書館中控制音樂播放,或是在吵雜的音樂會上口述訊息。
該技術既小巧又低功耗,也不會侵犯隱私,因為沒有資料離開用戶的手機。這樣,就不會有隱私上的擔憂。眼鏡配戴非常方便,比其他可用的無聲語音辨識技術更實用、更可行。
研究人員表示,該系統只需要幾分鐘的訓練資料來學習使用者的語音模式,學習完成後,就可以朝使用者的臉上發送和接收聲波,感知嘴部運動,同時使用深度學習演算法分析回波特徵。該系統目前能夠識別 31 個孤立的命令和一串連續的數字,且錯誤率低於 10%。
該系統目前的版本提供了大約 10 小時的電池續航,並且可以透過藍牙無線地與用戶的智慧型手機通訊。智慧型手機負責處理和預測所有數據,並將結果傳輸到一些“動作鍵”,讓它可以播放音樂、與智慧型裝置互動或啟動語音助理。
康乃爾大學智慧型電腦介面未來互動(SciFi)實驗室正在利用康乃爾大學的一個資助計畫來探索將這項技術商業化的可能性。
以上是科學家研發人工智慧聲吶眼鏡:可辨識唇語,準確率達95%的詳細內容。更多資訊請關注PHP中文網其他相關文章!

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

記事本++7.3.1
好用且免費的程式碼編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3漢化版
中文版,非常好用