MoDaコミュニティが、ワンクリックで写真をしゃべらせるAIビデオ生成ツール「Live Portait」を発表-AI-php.cn

ホームページ

テクノロジー周辺機器

MoDaコミュニティが、ワンクリックで写真をしゃべらせるAIビデオ生成ツール「Live Portait」を発表

王林

Aug 19, 2023 pm 05:21 PM

マジックコミュニティは、ワンクリックで写真の中のキャラクターをしゃべらせることができるAI動画生成ツール「ライブポートレート」をリリースしました

Alibaba Cloud は、Live Portrait と呼ばれるデジタルヒューマンビデオ生成ツールをリリースしました。ユーザーは写真とテキストまたは音声をアップロードするだけで、話すデジタルヒューマンビデオを生成できます。このツールは、ライブビデオブロードキャスト、チャットロボット、企業マーケティングなどのさまざまなシナリオで使用できます。現在、このツールは Magic Community Creation Space で体験可能です

魔搭社区上线AI视频生成工具Live Portait，可一键让照片开口说话

自己会話大型モデルや AI 絵画モデルの人気に伴い、研究コミュニティは生成 AI の研究を徐々に多様化させており、その中でも AI ビデオ生成技術が大きな注目を集めています。この技術は、テキストや音声などの情報を顔の動きの情報に変換し、キャラクター画像を含むアニメーション写真を生成することで、ビデオ撮影と制作の敷居を効果的に下げることができます。

Alibaba Cloud の最新の Live Portait ツールは、モーションモジュールと生成モジュールを組み合わせています。このツールは、Alibaba Cloud が独自に開発した口の形状予測アルゴリズムを使用しており、口の形状の生成の精度が大幅に向上し、従来の方法と比較して大幅に改善されています。トレーニング段階では、姿勢の明示的な制御が追加されるため、生成されたビデオはベースボードビデオを必要とせずにあらゆるアクションを表示できるため、デジタル人間の音声のリアリズムが大幅に向上します。さらに、アクティブアイコントロールテクノロジを通じて、Live Portait は眼球に自然な動きを追加し、生成された結果を現実の効果に近づけることができます。レポートによると、Live Portait 関連テクノロジーは、CVPR や ICCV

などの主要な国際 AI カンファレンスに組み込まれています。

魔搭社区上线AI视频生成工具Live Portait，可一键让照片开口说话

Magic Community からの情報によると、Live Portait は写真をアップロードした後にユーザーが選択できる 2 つの方法、つまりテキスト駆動とオーディオ駆動を提供します。テキスト駆動モードでは、ユーザーは中国語、英語、広東語、子供の声を含む 28 種類の音声から選択できます。さらに、Live Portait は、ユーザーがビデオをより速く生成できるようにするための軽量モデルの選択も提供します。

このツールのアルゴリズム責任者である Zhang Bang 氏は次のように述べています。「Live Portait は、単一の画像を使用してリアルな顔のアニメーションを生成する機能など、チームによって独自に開発された多数の革新的なテクノロジーを統合しており、従来の敵対的生成の制限を打ち破っています。技術の継続的な進化により、画像生成ビデオには幅広い応用の可能性があり、企業にとって生産効率を向上させ、コストを削減するための重要なツールになることが期待されています。」

このチームの研究の方向性には、デジタルヒューマン、3D モデル AI 生成、高忠実度レンダリング、人間とコンピューターの自然なインタラクションが含まれていると考えられており、主要な国際会議で 50 以上の論文を発表しています。

以上がMoDaコミュニティが、ワンクリックで写真をしゃべらせるAIビデオ生成ツール「Live Portait」を発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

人間の介入なしでLLMを訓練する7つの方法Apr 15, 2025 am 10:38 AM

自律AIのロック解除：自己トレーニングLLMの7つの方法子どもたちが複雑な概念を独立して習得するように、AIシステムが人間の介入なしに学び、進化する未来を想像してください。これはサイエンスフィクションではありません。それは自己の約束です

AIおよびNLGによる財務報告の変革-AnalyticsVidhyaApr 15, 2025 am 10:35 AM

AI搭載の財務報告：自然言語生成による洞察の革命今日のダイナミックなビジネス環境では、戦略的意思決定には正確でタイムリーな財務分析が最重要です。従来の財務報告

このGoogle Deepmindロボットは、2028年のオリンピックでプレイしますか？Apr 15, 2025 am 10:16 AM

Google Deepmind's Table Tennis Robot：スポーツとロボット工学の新しい時代パリ2024年のオリンピックは終わったかもしれませんが、Google Deepmindのおかげで、スポーツとロボット工学の新しい時代が夜明けです。彼らの画期的な研究（「「人間レベルの競争を達成する」

Gemini Flash1.5モデルで食品ビジョンWebAppを構築するApr 15, 2025 am 10:15 AM

Gemini Flash 1.5による効率とスケーラビリティのロック解除：Flask Food Vision WebApp 急速に進化するAIの状況では、効率とスケーラビリティが最重要です。開発者は、コストとレイテンシを最小限に抑える高性能モデルをますます求めています

LlamainDexを使用してAIエージェントを実装しますApr 15, 2025 am 10:11 AM

llamaindexを使用してAIエージェントのパワーを活用：ステップバイステップガイド迅速な計算であろうと最新の市場ニュースを取得するかどうかにかかわらず、リクエストを理解し、完璧に実行するパーソナルアシスタントを想像してください。この記事で探求します

.ipynbファイルをPDF-分析vidhyaに変換する5つの方法Apr 15, 2025 am 10:06 AM

Jupyter Notebook（.ipynb）ファイルは、データ分析、科学的コンピューティング、およびインタラクティブエンコーディングで広く使用されています。これらのノートブックは、他のデータサイエンティストとコードを開発および共有するのに最適ですが、PDFなどのより一般的に読みやすい形式に変換する必要がある場合があります。このガイドでは、.ipynbファイルをPDFに変換するさまざまな方法、およびヒント、ベストプラクティス、およびトラブルシューティングの提案をご覧ください。目次 .ipynbをPDFに変換する理由 .ipynbファイルをPDFに変換する方法 JupyterノートブックUIを使用します nbconveを使用します

LLMの量子化とユースケースに関する包括的なガイドApr 15, 2025 am 10:02 AM

導入大規模な言語モデル（LLM）は自然言語処理に革命をもたらしていますが、その計り知れないサイズと計算の要求は展開を制限しています。モデルを縮小し、計算コストを削減する手法である量子化は、重要なソルーです

Pythonを使用したSeleniumの包括的なガイドApr 15, 2025 am 09:57 AM

導入このガイドでは、Webオートメーションとテスト用のセレンとPythonの強力な組み合わせを探ります。 Seleniumはブラウザの相互作用を自動化し、大規模なWebアプリケーションのテスト効率を大幅に改善します。このチュートリアルはoに焦点を当てています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

ドリームウィーバー CS6

ビジュアル Web 開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、