Maison >Périphériques technologiques >IA >Microsoft annonce l'outil Text To Speech Avatar AI : peut créer des personnes numériques virtuelles en 3D, basé sur la plateforme Azure
Ce site a rapporté le 16 novembre que Microsoft avait lancé un outil d'IA appelé « Avatar Azure AI Speech text to Speech (TTS) » pour Azure AI Speech lors de la conférence Ignite, qui prétend être capable de générer des avatars humains réalistes (avatars numériques). personnes), cet outil est actuellement ouvert au public pour un aperçu et un essai.
Microsoft a déclaré que les utilisateurs peuvent utiliser l'avatar de synthèse vocale (TTS) Azure AI Speech pour créer des avatars virtuels basés sur "la saisie de texte pour prononcer du contenu", et le combiner avec une formation photo en personne réelle pour créer un avatar virtuel basé sur sur de vraies personnes. Le « chatbot interactif » peut être utilisé dans des scénarios de marketing d'entreprise, d'affaires ou de service client.
Il est rapporté que cet avatar de synthèse vocale (TTS) Azure AI Speech comprend principalement trois modules, à savoir l'analyseur de texte, le synthétiseur vocal TTS et le synthétiseur d'avatar virtuel TTS :Tout d'abord, l'analyseur de texte sera utilisé par les utilisateurs Le contenu du texte saisi est analysé et une séquence de phonèmes est générée. Ensuite, le modèle vocal TTS dans le synthétiseur vocal TTS prédit les caractéristiques acoustiques du texte saisi par l'utilisateur et synthétise le son. Enfin, le modèle de synthèse sonore du réseau neuronal Avatar prédira l'image de la forme des lèvres du personnage en fonction des caractéristiques acoustiques ci-dessus, et formera enfin une image d'avatar virtuelMicrosoft explique que la production traditionnelle de personnages virtuels prend du temps et est laborieuse, nécessitant la construction d'un environnement de tournage dédié et de post-montage. Le processus nécessite également des coûts considérables. Utilisant désormais le dernier service de rôle de synthèse vocale (TTS) Azure AI Speech de Microsoft, une fois le modèle établi, les utilisateurs n'ont plus qu'à saisir du texte pour créer diverses introductions de produits et vidéos interactives. La combinaison du service Microsoft Azure OpenAI et de la fonction TTS de réseau neuronal peut également présenter une expérience interactive plus naturelle
.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!