本站 11 月16 日消息,微軟在Ignite 大會中,為Azure AI Speech 推出了一項名為“Azure AI Speech text to speech (TTS) avatar”的AI 工具,號稱可以生成人類逼真虛擬化身(數位人),目前這款工具已經開放給大眾預覽試用。
微軟表示,使用者使用Azure AI Speech text to speech (TTS) avatar,可以建立基於「輸入文字說出內容」的虛擬化身,並結合現實人物照片訓練,建立以真實人物為基礎的「互動式聊天機器人」,可用於企業的行銷、業務或客戶服務等場景。
據悉,這項Azure AI Speech text to speech (TTS) avatar 主要包含三個模組,分別是文字分析器、TTS 聲音合成器及TTS 虛擬化身合成器:
首先,文字分析器將對使用者輸入的文字內容進行分析,產生音素序列。然後,TTS語音合成器中的TTS語音模型將會預測使用者輸入文字的聲學特徵,並合成聲音。最後,神經網路聲音合成模型Avatar將根據上述聲學特徵預測人物的唇形影像,最終形成虛擬化身影像
微軟解釋,傳統的虛擬化角色製作費時費力,需要搭建專用的拍攝環境,而後製剪輯的過程也需要花費相當多的成本。而現在使用微軟最新的Azure AI Speech文字轉語音(TTS)角色服務,一旦建立了模型,用戶只需要輸入文字就可以製作各種產品介紹和互動影片。結合微軟Azure OpenAI服務和神經網路TTS功能,還可以呈現更自然的互動體驗
本站發現,微軟舉例聲稱,使用者可利用Azure AI Speech TTS avatar 大量製作各種影片內容,例如企業文化影片、產品介紹或CEO 在大會上的數位分身。也可以製作虛擬直播數位人、聊天機器人、業務機器人、或線上教學的 AI 老師等。
微軟表示,Azure AI語音轉文字(TTS)虛擬化身已經向Azure訂閱用戶推出,支援多種語言。使用者可以從預設的虛擬化身選項中選擇所需角色,也可以自訂虛擬化身
#如果使用者想要自訂虛擬化身,需要上傳一系列人物影片片段。 Azure平台會在線上處理這些視頻,產生虛擬化身。角色本身與音源是分開的,使用者可以選擇官方提供的預設音源,也可以上傳自己訓練的音源
以上是微軟公佈 Text To Speech Avatar AI 工具:可製作虛擬 3D 數位人、基於 Azure 平台的詳細內容。更多資訊請關注PHP中文網其他相關文章!