3 月 4 日訊息,基於 ChatGPT 的必應聊天已經讓不少用戶感受到了 AI 的強大,而微軟於近日推出了更為強悍的全能型 AI--Kosmos-1。 ChatGPT 是純文字 LLM,而它是更強大的多模式大型語言模型(MLLM)。
#Kosmos-1 可以分析圖像的內容、解決視覺難題、執行視覺文字識別、透過視覺智商測驗以及理解自然語言指令等等。
IT之家從報道中獲悉,Kosmos-1 可以處理文字、音訊、圖像和視訊等內容,建構一個全能型的人工智慧,可以像人類思維一樣來處理任務。
研究人員在他們的學術論文中寫道:「作為智慧的基本組成部分,多模態感知是實現人工智慧的必要條件」。 Kosmos-1 論文中的視覺範例顯示模型分析圖像並回答有關圖像的問題,從圖像中讀取文本,為圖像編寫標題,並以 22-26% 的準確度進行視覺智商測試。
微軟表示,它計劃向開發人員提供 Kosmos-1,儘管該論文引用的 GitHub 頁面在本文發表時沒有明顯的 Kosmos 特定程式碼。
以上是比 ChatGPT 更強大,微軟推出全能人工智慧模型 Kosmos-1的詳細內容。更多資訊請關注PHP中文網其他相關文章!