Maison  >  Article  >  Périphériques technologiques  >  Microsoft lance le modèle d'intelligence artificielle CoDi pour interagir et générer du contenu multimodal

Microsoft lance le modèle d'intelligence artificielle CoDi pour interagir et générer du contenu multimodal

WBOY
WBOYavant
2023-07-11 13:17:401300parcourir

微软推出人工智能模型 CoDi,可互动和生成多模态内容

News le 11 juillet, Microsoft a récemment publié un communiqué de presse et lancé le Composable Diffusion Model (CoDi), qui est un modèle d'intelligence artificielle unique basé sur la diffusion combinable. Son objectif de conception est d'interagir et de générer du contenu multimodal.

Microsoft a conçu CoDi pour répondre aux limites des modèles d'IA monomodaux traditionnels. En prenant comme exemple la vidéo et l'audio synchronisés, il peut y avoir des incohérences et des problèmes d'alignement lorsque des flux d'informations générés indépendamment sont assemblés.

微软推出人工智能模型 CoDi,可互动和生成多模态内容

CoDi adopte une stratégie de génération combinable unique pour aligner plusieurs modalités pendant le processus de diffusion afin de générer des modèles entrelacés. Plus important encore, CoDi est capable de traiter des modes d'entrée arbitraires et de générer du contenu de n'importe quelle modalité.

微软推出人工智能模型 CoDi,可互动和生成多模态内容

CoDi a été développé par l'équipe de recherche Microsoft Azure Cognitive Services en collaboration avec l'Université de Caroline du Nord à Chapel Hill et fait partie du projet i-Code de Microsoft, qui utilise l'intelligence artificielle pour améliorer l'interaction homme-machine.

IT Home joint ici le lien d'introduction officiel du projet CoDi Les utilisateurs intéressés peuvent lire en profondeur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer