2024 年7 月5 日,上海-2024 世界人工智慧大會暨人工智慧全球治理高階會議(WAIC 2024)策略夥伴商湯科技召開「大愛無疆・向新力」 人工智慧論壇,發布國內首個所見即所得模型“日日新5o”,交互體驗對標GPT-4o,實現全新AI 交互模式。透過整合跨模態訊息,基於聲音、文字、圖像和視訊等多種形式,國內首個所見即所得模型「日日新5o」 帶來一種全新的AI 互動模式,即即時的串流多模態交互作用。現場也為大家展示了這種創新互動模式——工作人員剛開始僅是和「日日新5o」 打個招呼,它就自動識別出工作人員脖子佩戴的胸卡帶子上的字眼,判斷出現場就是世界人工智慧大會會場,並表示在這個地方可以「好好學習」。
接下來工作人員拿了一隻可愛小狗玩偶,「日日新5o」 準確描述了小狗的外貌、表情以及重要穿戴—— 一個帶著印有商湯科技logo 白帽子,很給主場人排面。 再上些難度,隨便翻開一本書的任何一頁,「日日新5o」 都能自動介紹,不是簡單的OCR 識別文字,而是識別圖文給出好理解的總結,這一切在瞬間即可完成,真正做到即時互動。 工作人員還現場發揮了“畫功”,隨手畫了一隻簡筆畫小兔子,“日日新5o”直呼畫得可愛,而後工作人員又畫了一個微笑表情,它從這個平靜的表情中捕捉到了笑意,工作人員又改了一筆把嘴巴畫大增添了舌頭,「日日新5o」看到後立刻說道這表情開心多了。能聽會看更會找話題,就如同真人聊天一般的交流對話,這種交互模式特別適用於實時對話和語音識別等應用,其多任務適應性強,能夠在同一模型中自然處理多種任務,且根據不同情境自適應調整行為與輸出,能夠實現對標GPT-4o 的交互體驗正是源自於「日日新5.5」基礎模型能力的全面提升。
今年4 月發表的「日日新5.0」是國內首個對標GPT-4 Turbo 的國產大模型,短短兩個多月時間,全新「日日新5.5」體系迎來多項升級,綜合表現較「日日新5.0」平均提升30%,在數學推理、英文能力和指令跟隨等能力明顯增強,交互效果及多項核心指標實現對標GPT-4o。
「日日新5.5」 採用混合端雲協同專家架構,最大限度發揮雲端端協同,降低推理成本,模型訓練基於超過10TB tokens 高品質訓練數據,包括大量合成的思維鏈數據,提升推理思維能力。 為了讓更多企業用戶低門檻接入並使用 “日日新” 大模型體系的強大能力,商湯於近期推出了 “大模型 0 元 Go” 計劃。以上是國內首個!商湯科技發表'日日新5o”,即時多模態串流互動對標GPT-4o的詳細內容。更多資訊請關注PHP中文網其他相關文章!