検索
ホームページテクノロジー周辺機器AIMicrosoft、仮想 3D デジタル ヒューマンを作成できる Text To Speech アバター AI ツールを発表

Microsoft は、Ignite カンファレンスで「Azure AI Speech text to speech (TTS) avatar」と呼ばれる AI ツールをリリースし、リアルな仮想キャラクターを生成できると主張しました。このツールはパブリック プレビューで利用できるようになりました

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

Microsoft は、ユーザーが Azure AI Speech テキスト読み上げ (TTS) アバターを使用して、「コンテンツを話すためのテキスト入力」に基づいて仮想アバターを作成し、それを実際の人物の写真トレーニングと組み合わせて「インタラクティブ アバター」ベースの構築ができると発表しました。 「チャットボット」は、企業のマーケティング、ビジネス、または顧客サービスのシナリオで使用できます。

レポートによると、Azure AI Speech のテキスト読み上げ (TTS) アバターは主に、テキスト アナライザー、TTS サウンド シンセサイザー、TTS 仮想アバター シンセサイザーの 3 つのモジュールで構成されています。

テキスト アナライザーは、まずユーザーが入力したテキスト コンテンツを分析し、音素シーケンスを生成します。次に、TTS サウンド シンセサイザーの TTS 音声モデルがユーザーの入力テキストの音響特性を予測し、サウンドを合成します。最後に、ニューラル ネットワーク音声合成モデル Avatar が、上記の音響特性に基づいてキャラクターの唇の画像を予測し、最終的に仮想アバター画像を形成します。

マイクロソフトは、従来のアバター制作には時間と労力がかかり、専用の撮影環境の構築が必要であり、撮影と編集のポストプロダクションプロセスにもかなりのコストがかかると説明しました。現在、Microsoftの最新のAzure AI Speech Text to Speech(TTS)アバターサービスを利用しており、初めてモデルを確立した後は、テキストを入力するだけでさまざまな製品紹介やインタラクティブな動画などを作成できる。 Microsoft Azure OpenAI Service およびニューラル ネットワーク TTS 機能と組み合わせることで、より自然なインタラクティブなエクスペリエンスを提供することもできます。

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人IT House は、Microsoft が、ユーザーが Azure AI Speech TTS アバターを使用して、企業文化ビデオ、製品紹介、カンファレンスでの CEO のデジタル アバターなどのさまざまなビデオ コンテンツをバッチ作成できる例を示したと報告しました。さらに、仮想ライブ配信のデジタル ヒューマン、チャット ロボット、ビジネス ロボット、オンライン教育用の AI 教師などを作成することもできます。

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人Microsoft は、Azure AI Speech Synthesis (TTS) アバターが Azure サブスクライバーに利用可能になり、複数の言語をサポートすると発表しました。ユーザーは、プリセットのアバター オプションから希望の役割を選択するか、アバターをカスタマイズできます

微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人ユーザーが独自の仮想アバターをカスタマイズしたい場合は、キャラクター ビデオ クリップのバッチをアップロードする必要があります。Azure プラットフォームはこれらのビデオをオンラインで処理して仮想アバターを生成します。キャラクター本体と音源は分離されており、ユーザーは公式のデフォルト音源を選択するか、独自のトレーニング音源をアップロードすることができます。

以上がMicrosoft、仮想 3D デジタル ヒューマンを作成できる Text To Speech アバター AI ツールを発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
カーソルAIでバイブコーディングを試してみましたが、驚くべきことです!カーソルAIでバイブコーディングを試してみましたが、驚くべきことです!Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Dall-E 3の使用方法:ヒント、例、および機能Dall-E 3の使用方法:ヒント、例、および機能Mar 09, 2025 pm 01:00 PM

Dall-E 3:生成AI画像作成ツール 生成AIはコンテンツの作成に革命をもたらし、Openaiの最新の画像生成モデルであるDall-E 3が最前線にあります。 2023年10月にリリースされ、前任者のDall-EとDall-E 2に基づいています

2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など!2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など!Mar 22, 2025 am 10:58 AM

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

オブジェクト検出にYolo V12を使用する方法は?オブジェクト検出にYolo V12を使用する方法は?Mar 22, 2025 am 11:07 AM

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

SORA vs VEO 2:よりリアルなビデオを作成するのはどれですか?SORA vs VEO 2:よりリアルなビデオを作成するのはどれですか?Mar 10, 2025 pm 12:22 PM

GoogleのVEO 2とOpenaiのSORA:どのAIビデオジェネレーターが最高でしたか? どちらのプラットフォームも印象的なAIビデオを生成しますが、その強みはさまざまな領域にあります。 この比較は、さまざまなプロンプトを使用して、どのツールがニーズに最適かを明らかにします。 t

Google' s Gencast:Gencast Mini Demoを使用した天気予報Google' s Gencast:Gencast Mini Demoを使用した天気予報Mar 16, 2025 pm 01:46 PM

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

chatgptよりも優れたAIはどれですか?chatgptよりも優れたAIはどれですか?Mar 18, 2025 pm 06:05 PM

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)

ChatGpt 4 oは利用できますか?ChatGpt 4 oは利用できますか?Mar 28, 2025 pm 05:29 PM

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境