Microsoft は、Ignite カンファレンスで「Azure AI Speech text to speech (TTS) avatar」と呼ばれる AI ツールをリリースし、リアルな仮想キャラクターを生成できると主張しました。このツールはパブリック プレビューで利用できるようになりました
Microsoft は、ユーザーが Azure AI Speech テキスト読み上げ (TTS) アバターを使用して、「コンテンツを話すためのテキスト入力」に基づいて仮想アバターを作成し、それを実際の人物の写真トレーニングと組み合わせて「インタラクティブ アバター」ベースの構築ができると発表しました。 「チャットボット」は、企業のマーケティング、ビジネス、または顧客サービスのシナリオで使用できます。
レポートによると、Azure AI Speech のテキスト読み上げ (TTS) アバターは主に、テキスト アナライザー、TTS サウンド シンセサイザー、TTS 仮想アバター シンセサイザーの 3 つのモジュールで構成されています。
テキスト アナライザーは、まずユーザーが入力したテキスト コンテンツを分析し、音素シーケンスを生成します。次に、TTS サウンド シンセサイザーの TTS 音声モデルがユーザーの入力テキストの音響特性を予測し、サウンドを合成します。最後に、ニューラル ネットワーク音声合成モデル Avatar が、上記の音響特性に基づいてキャラクターの唇の画像を予測し、最終的に仮想アバター画像を形成します。マイクロソフトは、従来のアバター制作には時間と労力がかかり、専用の撮影環境の構築が必要であり、撮影と編集のポストプロダクションプロセスにもかなりのコストがかかると説明しました。現在、Microsoftの最新のAzure AI Speech Text to Speech(TTS)アバターサービスを利用しており、初めてモデルを確立した後は、テキストを入力するだけでさまざまな製品紹介やインタラクティブな動画などを作成できる。 Microsoft Azure OpenAI Service およびニューラル ネットワーク TTS 機能と組み合わせることで、より自然なインタラクティブなエクスペリエンスを提供することもできます。
IT House は、Microsoft が、ユーザーが Azure AI Speech TTS アバターを使用して、企業文化ビデオ、製品紹介、カンファレンスでの CEO のデジタル アバターなどのさまざまなビデオ コンテンツをバッチ作成できる例を示したと報告しました。さらに、仮想ライブ配信のデジタル ヒューマン、チャット ロボット、ビジネス ロボット、オンライン教育用の AI 教師などを作成することもできます。
Microsoft は、Azure AI Speech Synthesis (TTS) アバターが Azure サブスクライバーに利用可能になり、複数の言語をサポートすると発表しました。ユーザーは、プリセットのアバター オプションから希望の役割を選択するか、アバターをカスタマイズできます
ユーザーが独自の仮想アバターをカスタマイズしたい場合は、キャラクター ビデオ クリップのバッチをアップロードする必要があります。Azure プラットフォームはこれらのビデオをオンラインで処理して仮想アバターを生成します。キャラクター本体と音源は分離されており、ユーザーは公式のデフォルト音源を選択するか、独自のトレーニング音源をアップロードすることができます。
以上がMicrosoft、仮想 3D デジタル ヒューマンを作成できる Text To Speech アバター AI ツールを発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Dall-E 3:生成AI画像作成ツール 生成AIはコンテンツの作成に革命をもたらし、Openaiの最新の画像生成モデルであるDall-E 3が最前線にあります。 2023年10月にリリースされ、前任者のDall-EとDall-E 2に基づいています

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

GoogleのVEO 2とOpenaiのSORA:どのAIビデオジェネレーターが最高でしたか? どちらのプラットフォームも印象的なAIビデオを生成しますが、その強みはさまざまな領域にあります。 この比較は、さまざまなプロンプトを使用して、どのツールがニーズに最適かを明らかにします。 t

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

ホットトピック



