首頁 >科技週邊 >IT業界 >阿里雲宣布自研 EMO 模型上線通義 App，用照片 + 音頻生成唱歌視頻

阿里雲宣布自研 EMO 模型上線通義 App，用照片 + 音頻生成唱歌視頻

王林轉載: 2024-04-26 08:00:381130瀏覽

「本站4月25日消息，EMO（Emote Portrait Alive）是一個由阿里巴巴集團智能計算研究院開發的框架，一個音頻驅動的AI肖像視頻生成系統，能夠通過輸入單一的參考圖像和語音音頻，產生具有表現力的面部表情和各種頭部姿勢的視頻。用戶免費使用。透過這項功能，使用者可以在歌曲、熱梗、表情包中任選一款模板，然後透過上傳一張肖像照片就能讓 EMO 合成演唱影片。

根據介紹，通義App 首批上線了80多個EMO 模板，包括熱門歌曲《上春山》《野狼Disco》等，還有網路熱梗「缽缽雞」「回手掏」等，但目前暫未提供自訂音訊。

本站附EMO 官網入口：

https://humanaigc.github.io/emote-portrait-alive/
https://arxiv.org/abs/2402.17485
https://github.com/HumanAIGC/EMO
（模型和原始碼待開源）

EMO的主要特點

以上是阿里雲宣布自研 EMO 模型上線通義 App，用照片 + 音頻生成唱歌視頻的詳細內容。更多資訊請關注PHP中文網其他相關文章！

github https

陳述：

本文轉載於：ithome.com。如有侵權，請聯絡admin@php.cn刪除

上一篇：仰望旗艦車型U7線下首秀搭載革命性技術雲輒-Z下一篇：仰望旗艦車型U7線下首秀搭載革命性技術雲輒-Z

看更多