Google今天發布了一篇新聞稿,正式介紹了他們推出的名為Translatotron 3的新型人工智慧模型。這個模型無需任何平行語音數據,可以實現語音對語音的同聲傳譯翻譯
#Google在2019年推出了Translatotron S2ST系統,並在2021年7月推出了第二個版本。在2023年5月27日發布的一篇論文中,Google宣布正在部署新的方法,用於訓練Translatotron 3
研究人員稱,Translatotron 2 已經提供了卓越的翻譯品質、語音魯棒性(Robust)和語音自然度,而Translatotron 3 實現「第一個完全無監督直接語音到語音翻譯的端對端模型」。
傳統上的S2ST透過自動語音辨識機器翻譯文字到語音合成的級聯方法來解決,但Translatotron 3採用了一種新穎的端對端架構,直接將源語言語音映射到目標語言,而不依賴中間文字表示
Translatotron 3 模型還可用於創建幫助有語言障礙的人的工具,或開發更具吸引力和有效性的個人化語言學習工具。
需要重寫的內容是:來源:IT之家
以上是AI同聲傳譯新突破,Google發布Translatotron 3模型:可繞過文字轉換步驟的詳細內容。更多資訊請關注PHP中文網其他相關文章!