3월 4일자 뉴스에 따르면, ChatGPT를 기반으로 한 Bing 채팅은 많은 사용자들에게 AI의 위력을 실감하게 했고, 마이크로소프트는 최근 더욱 강력한 만능 AI인 코스모스-1(Kosmos-1)을 출시했습니다. ChatGPT는 더욱 강력한 다중 모달 대형 언어 모델(MLLM)인 일반 텍스트 LLM입니다.
Kosmos-1은 이미지 내용 분석, 시각적 퍼즐 풀기, 시각적 텍스트 인식 수행, 시각적 IQ 테스트 통과, 자연어 명령 이해 등을 수행할 수 있습니다.
IT House는 보고서를 통해 Kosmos-1이 텍스트, 오디오, 이미지, 비디오 및 기타 콘텐츠를 처리하여 인간의 사고와 같은 작업을 처리할 수 있는 만능 인공 지능을 구축할 수 있다는 사실을 알게 되었습니다.
연구원들은 학술 논문에서 다음과 같이 썼습니다. "지능의 기본 구성 요소로서 다중 모드 인식은 인공 지능을 구현하는 데 필요한 조건입니다." Kosmos-1 논문의 시각적 예는 이미지를 분석하고 이미지에 대한 질문에 대답하고, 이미지에서 텍스트를 읽고, 이미지에 대한 캡션을 작성하고, 22-26% 정확도로 시각적 IQ 테스트를 수행하는 모델을 보여줍니다.
Microsoft는 Kosmos-1을 개발자들에게 제공할 계획이라고 밝혔지만, 논문에서 참조한 GitHub 페이지에는 발행 시점에 명확한 Kosmos 관련 코드가 없습니다.
위 내용은 ChatGPT보다 강력한 마이크로소프트, 만능 인공지능 모델 코스모스-1 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!