7월 11일 뉴스 Microsoft는 최근 보도 자료를 발표하고 결합 가능한 확산을 기반으로 하는 고유한 인공 지능 모델인 CoDi(Composable Diffusion Model)를 출시했습니다. 설계 목표는 다중 모드 콘텐츠와 상호 작용하고 생성하는 것입니다.
Microsoft는 기존 단일 모달 AI 모델의 한계를 해결하기 위해 CoDi를 설계했습니다. 동기화된 비디오 및 오디오를 예로 들면, 독립적으로 생성된 정보 스트림이 함께 연결될 때 불일치 및 정렬 문제가 발생할 수 있습니다.
CoDi는 확산 과정에서 여러 양식을 정렬하여 서로 얽힌 패턴을 생성하는 고유한 결합 가능 생성 전략을 채택합니다. 더 중요한 것은 CoDi가 임의의 입력 모드를 처리하고 모든 양식의 콘텐츠를 생성할 수 있다는 것입니다.
CoDi는 Microsoft Azure Cognitive Services 연구팀이 채플힐에 있는 노스캐롤라이나 대학과 협력하여 개발했으며 인공 지능을 사용하여 인간과 컴퓨터의 상호 작용을 향상시키는 Microsoft Project i-Code의 일부입니다.
IT Home에 CoDi 프로젝트의 공식 소개 링크를 첨부합니다. 관심 있는 사용자는 자세히 읽어볼 수 있습니다.
위 내용은 Microsoft, 다중 모드 콘텐츠 상호 작용 및 생성을 위한 인공 지능 모델 CoDi 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!