ホームページ >テクノロジー周辺機器 >IT業界 >Alibaba Cloud は、写真と音声を使用して歌のビデオを生成する、Tongyi アプリ上で自社開発した EMO モデルの開始を発表しました。

Alibaba Cloud は、写真と音声を使用して歌のビデオを生成する、Tongyi アプリ上で自社開発した EMO モデルの開始を発表しました。

王林転載: 2024-04-26 08:00:381122ブラウズ

「本サイトは4月25日、EMO（Emote Portrait Alive）はアリババグループ知能計算研究所が開発したフレームワークであると報じた。単一の参照画像と音声を入力できるオーディオ駆動型のAIポートレートビデオ生成システムである」

Alibaba Cloud は本日、研究所 EMO を通じて開発された AI モデルが一般アプリとして正式にリリースされ、誰でも利用できることを発表しました。無料です。ユーザーにとって。この機能では、ユーザーは曲、ホットミーム、顔文字からテンプレートを選択し、ポートレート写真をアップロードすると、EMO が歌のビデオを合成できます。

紹介文によると、Tongyi App は、人気曲「Up Spring Mountain」を含む、最初のバッチとして 80 以上の EMO テンプレートをリリースしました。「ワイルドウルフディスコ」などのほか、「ボボチキン」、「バックハンドディギング」などの人気のインターネットミームもありますが、現在カスタムオーディオは提供されていません。

このサイトには、EMO 公式 Web サイトの入り口が添付されています:

公式プロジェクトのホームページ: https://humanaigc.github.io/emote-portrait-生きています/
arXiv 研究論文: https://arxiv.org/abs/2402.17485
GitHub: https://github.com/HumanAIGC/EMO (モデルとソースコードはオープンソースになります)

##EMO の主な機能

以上がAlibaba Cloud は、写真と音声を使用して歌のビデオを生成する、Tongyi アプリ上で自社開発した EMO モデルの開始を発表しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

github https

声明：

この記事はithome.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：革新的な技術Yunnan-Zを搭載したフラッグシップモデルU7のオフラインデビューが楽しみ次の記事：革新的な技術Yunnan-Zを搭載したフラッグシップモデルU7のオフラインデビューが楽しみ

続きを見る