Maison > Article > Périphériques technologiques > Microsoft lance le modèle d'intelligence artificielle CoDi pour interagir et générer du contenu multimodal
News le 11 juillet, Microsoft a récemment publié un communiqué de presse et lancé le Composable Diffusion Model (CoDi), qui est un modèle d'intelligence artificielle unique basé sur la diffusion combinable. Son objectif de conception est d'interagir et de générer du contenu multimodal.
Microsoft a conçu CoDi pour répondre aux limites des modèles d'IA monomodaux traditionnels. En prenant comme exemple la vidéo et l'audio synchronisés, il peut y avoir des incohérences et des problèmes d'alignement lorsque des flux d'informations générés indépendamment sont assemblés.
CoDi adopte une stratégie de génération combinable unique pour aligner plusieurs modalités pendant le processus de diffusion afin de générer des modèles entrelacés. Plus important encore, CoDi est capable de traiter des modes d'entrée arbitraires et de générer du contenu de n'importe quelle modalité.
CoDi a été développé par l'équipe de recherche Microsoft Azure Cognitive Services en collaboration avec l'Université de Caroline du Nord à Chapel Hill et fait partie du projet i-Code de Microsoft, qui utilise l'intelligence artificielle pour améliorer l'interaction homme-machine.
IT Home joint ici le lien d'introduction officiel du projet CoDi Les utilisateurs intéressés peuvent lire en profondeur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!