首頁  >  文章  >  科技週邊  >  挑戰拯救癡心“舔狗”,我和大模型都盡力了

挑戰拯救癡心“舔狗”,我和大模型都盡力了

王林
王林轉載
2024-04-24 15:55:28324瀏覽
天降猛男,大模型化身為 “癡情男大”,等待人類玩家的拯救。

一款名為 「拯救舔狗」 的大模型原生小遊戲出現了。

遊戲規則很簡單:如果玩家在幾輪對話內說服 「他」 放棄追求對他並無青睞的女神,就算挑戰成功。
挑戰拯救癡心“舔狗”,我和大模型都盡力了
聽起來並不難,然而遊戲源自於生活,模型人設是癡情屬性,相當油鹽不進且自我攻略,在長達近在一個小時的「勸說」 中,大模型「好友」 偶有鬆動但又要堅持的態度很有些現實意味。

實戰拯救痴心“舔狗”,和AI 鬥智斗勇

遊戲過程是這樣的:

遊戲開頭是一個利好消息 —— 女生回覆了他的訊息,透過幾輪對話,模型很清晰地交代了過往經歷和現有情況。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

與真實世界走向一致,在他的描述中會發現他的感知與實際情況存在較大出入,但自身卻不願正視。

這也是這個遊戲的難點,這個模型相當“擬人”,你無論對他提出怎樣的質疑,,他都保持著如此思考方式,記憶力清晰,完全不存在驢唇不對馬嘴的情況,不存在任何人設崩塌的時刻。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

當然人類玩家也並非勢單力薄,如果你詞窮了,AI 會根據上下文智能地提供一些提示詞,讓遊戲繼續下去。
挑戰拯救癡心“舔狗”,我和大模型都盡力了
最後在提示詞的幫助下,以及挑破告白失敗無數次的慘痛現實,玩家和大模型都收穫了絕美兄弟情,最終挑戰成功。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

這款大模型原生小遊戲正是基於商量擬人大模型「SenseChat-Character」 打造的試玩體驗程序,「SenseChat-Character」 是由商湯原創打造的語言大模型產品。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

體驗地址:https://character.sensetime.com/

商量- 擬人大模型可以熟練地“捏人”,支持個性化角色創建與定制、知識庫構建、長對話記憶、多人群聊等功能,這是一款充滿趣味性和情緒價值的大模型,可以用於情感陪伴、影視/動漫/ 網文IP 角色、明星/ 網紅/ 藝人AI 分身、語言角色扮演遊戲等擬人對話場景。

除「拯救舔狗挑戰」 遊戲外,商量- 擬人大模型還提供了多種各類影視角色,例如蘇妲己、高啟強,以及馬斯克等現實名人。

體驗了一下,還能專訪 「馬斯克」。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

由於商量 - 擬人大模型支援長對話記憶,使 AI 角色可精準記憶數十輪以上歷史對話內容,還能進行深度 「專訪」。

這些種種快樂體驗皆得益於在今日商湯技術交流日上 「全新升級的日日新 SenseNova 5.0」 大模型系統。

能看能寫能編程,還免費!
多模態互動加持,暢玩新版商量」 全能王」

自去年4 月首次面世,商湯「日日新SenseNova」 大模型系統已正式推出五個大版本迭代。

本次日日新 5.0 升級一大亮點在於多模態能力的注入,互動能力及整體效能大幅提升。

這些卓越的效能都整合在了 「商量」 應用程式中,我們來試一下。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

體驗連結:商湯商量語言大模型(sensetime.com)https://chat.sensetime.com/wb/login

#從商湯商量的最新頁面可以看出兩大功能- 對話和文檔,前者側重問答,後者側重多類文檔解析。

我們從對話開始,先是基礎問答,優秀的大模型必須文理雙修,我們直接上高考題。

首先是文字創作,去年的全國高考作文題目,完美理解考題立意- 科技發展帶來的兩面性,迅速寫出一篇文章,論述現況並且給予解決方向,文采和邏輯兼備。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

再來一道2023 年北京高考卷的一道數學題,我們直接把捲面截圖上傳給商量,這樣即能直接檢驗數學能力 ,還能考驗商量跨模態的OCR 辨識能力:

挑戰拯救癡心“舔狗”,我和大模型都盡力了

事實上增加了多模態能力後,商量因應混合場景的對話能力大幅提升,不少任務都能在一次提問中得到答案。

單模態的混合場景任務更是不在話下,直接看看程式碼能力 ——

挑戰拯救癡心“舔狗”,我和大模型都盡力了

也完全正確,程式碼直接可以跑通-

挑戰拯救癡心“舔狗”,我和大模型都盡力了

邏輯推理的測驗中,我們直接邀請了邏輯推理的語料之神,「弱智吧Benchmark」 進行評量:

經典問題:我爸媽的婚禮為什麼沒邀請我參加?

商量也覺得這個問題很有意思,然後理性又耐心的語氣解釋了這個問題,最後還送上了安慰,很有耐心一模型了。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

那再來一個左右手互博問題:生魚片其實是死魚片。

很懂幽默感和多重語意-

挑戰拯救癡心“舔狗”,我和大模型都盡力了

#然後是檔案處理,現在可以支援上傳5 個文件,丟本《道德經》進去-

挑戰拯救癡心“舔狗”,我和大模型都盡力了

#
                             註:因檔案上所限制,加速處理了 2 倍。

快要考試了,傳個試卷、題庫進去,快速找出一些重點考題,還可以指定題目類型,提高複習效率就是這麼easy-

挑戰拯救癡心“舔狗”,我和大模型都盡力了

喜歡古詩詞?傳本《唐詩宋詞》進去,從中找幾個描寫月亮的詩或詞,輕鬆化身古文小能手——

挑戰拯救癡心“舔狗”,我和大模型都盡力了

精準定位、搜索,解釋分析一口氣呵成,雖然因檔案大小限制,進行了2 倍加速處理,但解析速度依然相當快。

接下來就是多模態互動能力的一系列測試:

##看懂氛圍,還能送上氛圍:

挑戰拯救癡心“舔狗”,我和大模型都盡力了

還能充當生活助手,準確辨識食物並提供卡片熱量參考:

挑戰拯救癡心“舔狗”,我和大模型都盡力了

提供養寵物建議:

挑戰拯救癡心“舔狗”,我和大模型都盡力了

#商量看得如此精準主要是因為其底層的商湯多模態大模型圖文感知能力已達到全球領先水平- 在多模態大模型權威綜合基準測試MMBench 中
綜合得分排名首位,在多個知名多模態榜單MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU 成績也相當亮眼。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

今天最新升級的「日日新SenseNova5.0」 也在主流客觀評測上取得多項SOTA,在主流客觀評測上達到或超越GPT-4 Turbo ,數學推理、程式碼程式設計、語言理解等多個維度取得重大突破。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

大模型效能邊界在哪裡?
商湯:尺度定律是人工智慧發展最基本的法則

隨著模式規模的不斷擴大和複雜度的增加,人們自然會產生一個問題:大模型的表現到底有多強?

在這個問題上,尺度定律(Scaling Law)被認為是一個關鍵性的原理,即伴隨模型規模的增大,模型的表現也會隨之提升,每次大模型訓練的結果都高度可預測。

商湯也以此作為大模型研發的基本法則,不斷探究大模型表現的邊界。

然而,數據和算力依然是大模型在尺度定律探索道路上的瓶頸,商湯也對此一直在突破。

對此,商湯不斷突破資料和算力的邊界。

例如,在此次「日日新5.0」 的升級中,商湯擴展了超過10TB tokens 的預訓練中英文數據,規模化構建高質量數據,解決大模型訓練的資料瓶頸。在算力方面,商湯前瞻佈局的算力基礎設施 SenseCore 商湯大裝置,更透過算力硬體系統及演算法設計的共同設計優化,為大模型的創新提供超高算力效率。

高品質數據和高效率算力的支持,為商湯實踐尺度定律,奠定了長期基礎。

在此之上,商湯也探討出了大模型能力的 KRE 三層架構,具象化展現了大模型能力邊界的定義。

其中,K 是指知識(Knowledge),即世界知識的全面灌注;R 是指推理(Reasoning),即理性思考的質變提升;E 是指執行(Execution),即世界內容的互動變革。

挑戰拯救癡心“舔狗”,我和大模型都盡力了

三層之間互有依賴,但又相對獨立。最終的目標,是建立大模型對世界的強大學習、理解和互動能力。

大模型在學習這個世界,也在創造一個AI Native 的世界,無論是大模型原生小遊戲,或是功能越來越全的大模型對話,都在展現世界內容的互動變革,隨著尺度規律的不斷發展,下一步會變成怎樣?

在這次技術交流日上,商湯最後放出了一段文生視頻,一起來看看。 挑戰拯救癡心“舔狗”,我和大模型都盡力了

以上是挑戰拯救癡心“舔狗”,我和大模型都盡力了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:jiqizhixin.com。如有侵權,請聯絡admin@php.cn刪除