ホームページ > 記事 > テクノロジー周辺機器 > Microsoft、マルチモーダルコンテンツを対話および生成する人工知能モデル CoDi を発表
7 月 11 日のニュースによると、マイクロソフトは最近プレス リリースを発行し、組み合わせ可能な拡散に基づく独自の人工知能である組み合わせ可能な拡散モデル (CoDi) を開始しました。マルチモーダルコンテンツを生成します。
Microsoft は、従来の単一モダリティ AI モデルの制限に対処するために CoDi を設計しました。同期されたビデオとオーディオを例にとると、個別に生成された情報ストリームが結合されると、不整合や位置合わせの問題が発生する可能性があります。
CoDi は、拡散プロセス中に複数のモダリティを調整して絡み合ったパターンを生成する、独自の組み合わせ可能な生成戦略を採用しています。さらに重要なのは、CoDi はあらゆる入力パターンを処理し、コンテンツを生成できることです。任意のモーダル。
CoDi は、Microsoft Azure Cognitive Services Research Team がノースカロライナ大学チャペルヒル校と協力して開発したもので、Microsoft プロジェクト i-Code の一部です。人間とコンピューターの相互作用を強化する人工知能。
IT House は CoDi プロジェクトの #公式紹介リンク をここに添付します。興味のあるユーザーは詳しく読むことができます。
以上がMicrosoft、マルチモーダルコンテンツを対話および生成する人工知能モデル CoDi を発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。