ホームページ > 記事 > テクノロジー周辺機器 > Alibaba Cloud は、写真と音声を使用して歌のビデオを生成する、Tongyi アプリ上で自社開発した EMO モデルの開始を発表しました。
「本サイトは4月25日、EMO(Emote Portrait Alive)はアリババグループ知能計算研究所が開発したフレームワークであると報じた。単一の参照画像と音声を入力できるオーディオ駆動型のAIポートレートビデオ生成システムである」
Alibaba Cloud は本日、研究所 EMO を通じて開発された AI モデルが一般アプリとして正式にリリースされ、誰でも利用できることを発表しました。無料です。ユーザーにとって。この機能では、ユーザーは曲、ホットミーム、顔文字からテンプレートを選択し、ポートレート写真をアップロードすると、EMO が歌のビデオを合成できます。
紹介文によると、Tongyi App は、人気曲「Up Spring Mountain」を含む、最初のバッチとして 80 以上の EMO テンプレートをリリースしました。 「ワイルド ウルフ ディスコ」などのほか、「ボボ チキン」、「バック ハンド ディギング」などの人気のインターネット ミームもありますが、現在カスタム オーディオは提供されていません。
このサイトには、EMO 公式 Web サイトの入り口が添付されています:
公式プロジェクトのホームページ: https://humanaigc.github.io/emote-portrait-生きています/
arXiv 研究論文: https://arxiv.org/abs/2402.17485
GitHub: https://github.com/HumanAIGC/EMO (モデルとソースコードはオープンソースになります)
以上がAlibaba Cloud は、写真と音声を使用して歌のビデオを生成する、Tongyi アプリ上で自社開発した EMO モデルの開始を発表しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。