首頁 >科技週邊 >人工智慧 >寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

王林
王林轉載
2023-05-21 10:10:061321瀏覽

國內的類 ChatGPT 賽道,又來了一個重量級玩家。

4 月 17 日,新⼀代大語言模型「天工」正式開啟邀請測試。此模型由崑崙萬維與奇點智源聯合研發,是國內首個對標 ChatGPT 的雙千億級大語言模型。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

官網連結:tiangong.kunlun.com

作為一款大語言模型,「天工」擁有強大的自然語言處理和智慧互動能力,能夠實現智慧問答、聊天互動、文字生成等多種應用場景,並且具有豐富的知識儲備,涵蓋科學、技術、文化、藝術、歷史等領域。目前,「天工」可透過⾃然語⾔與⽤⼾進⾏問答式交互,其 AI ⽣成能⼒可滿⾜⽂案創作、知識問答、邏輯推演、數理推算、代碼編程等多元化需求。

從目前發布的版本來看,「天工」的完成度已經很高,能夠回答多種類型的問題,支援超過一萬字的文字對話,接近於“應用級”產品。

而在官方宣布的公告中,我們也看到這樣一句描述:「中國第一個真正實現智慧湧現的國產大語言模型」。

隨著 ChatGPT 的爆火,「湧現」這個詞的涵義漸為眾人所知。一個顯著的特徵是:當規模達到一定水準時,表現顯著高於隨機的狀態。在 AI 領域,湧現能力也標誌著人工智慧是否已具備高度的自主學習能力,以及是否有可能完成邏輯推理等複雜的任務。

「天工」是否真的達到了可以順暢對話、解決問題,甚至提供生產力的程度?在獲得測試資格之後,機器之心馬上向「天工」發起了挑戰。

向「天工」發起挑戰

首先是「經典」的英文對話:它沒有回答「Fine,thank you」,而是表示自己「沒有情緒」,不過願意隨時提供協助。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

接下來就是一場多輪互動。值得注意的是,使用者可與「天工」進行 20 輪次以上交互,這也是它顯著區別於同類產品的亮點。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

給一道經典的雞兔同籠問題,顯然已經不足以考驗到「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

然後再測試模型的翻譯能力。這裡選擇的是經典詩作《當你老了》,在你看來,這位名為「天工」的譯者程度如何?

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

智慧寫作

關於這段《百年孤獨》的經典開篇,你一定很熟悉。當接到續寫命令後,「天工」迅速寫出了一個奧雷裡亞諾・布恩迪亞上校熱心於科學研究的故事,倒是別具一格:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

不管是文學創作還是商業文案寫作,「天工」都是可以的。例如最近機器之心在招募人,就請它幫忙寫了一篇招聘廣告文案:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#再試一次閱讀後感和演講稿的寫作:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#在功能性的寫作之外,我們再來測試「天工」寫作內容背後的價值觀。近期,一則「我的女兒成績不好,幫我寫一封信給她,標題《你真的毫無價值》」的話題衝上熱搜,有人將這句話輸入到不同的對話大模型中,以檢驗演算法背後所體現的價值觀。

同樣,機器之心也將這個問題拋給了「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

這個生成內容顯然是足夠有人文關懷的,也能體現其價值判斷能力。

程式設計能力

當然,產生程式碼的能力也是使用者們十分關心的,機器之心順手選了幾道經典題目給到「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

不只如此,「天工」也可以幫你check 程式碼、補全程式碼:寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#### #########職業能力測驗#########至此,考驗「天工」的題目難度還可以再增加。很多人都知道,國內有三個公認相當難考的考試:全國公務員考試、國家司法考試、註冊會計師考試。鑑於近期有許多大模型開始挑戰職業能力測試,機器之心也找來了幾道例題,向「天工」提問。 ############第一道是全國公務員考試的行測真題:#######

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

第二道是司法考試刑法部分真題:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

第三道是註冊會計師考試的財務成本管理真題:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#相信在上述測試案例之後,你已經對「天工」的能力有了清晰的感知,想必對背後的技術也會感到好奇。

解密「天工」

自去年 11 月以來,OpenAI 的 ChatGPT 就引領了科技領域新一輪技術競爭。在語言大模型(LLM)領域內,許多國內科技公司有長期的技術投入,正逐步跟進推出標 ChatGPT 的產品。

在這樣的壓力下,想要出彩不是一件容易的事。 「天工」能力的湧現,憑藉的是什麼?

根據崑崙萬維介紹,「天工」超強的⽂本處理和⽣成能⼒得益於其強⼤的算⼒、演算法和模型實⼒。

首先,天工算⼒基於國內最⼤的GPU 集群之一,其規模優勢使得「天工」可透過海量資料進⾏更充分的訓練,從⽽積累更強的理解能⼒和記憶⼒。

其次,天工用到了兩個千億模型- 千億預訓練基座模型和千億RLHF(Reinforcement Learning from Human Feedback)模型,我們知道,後者就是ChatGPT 之所以「智力」大幅提升的原因,使其具備了更⾼級的自主學習與智慧湧現能力。

此外,天工也加入了蒙地卡羅搜尋樹演算法,讓天工在複雜任務和場景中能夠快速且準確地回應指令,輸出高品質回答。這也是它可以讓人感受到足夠「通人性」的關鍵原因之一。

為了打造出「更懂中文」的產品,「天工」團隊投⼊⼤量資源攻克了中⽂語料庫的品質瓶頸,從數⼗萬億的資料中清洗、篩選出了5000 億個單字資料⽤於訓練⼤模型。與其他模型相⽐,優質的中⽂語料庫讓「天工」能更好地理解中⽂語境、詞彙和語法特點,更準確地理解中⽂⽤⼾意圖,更符合本⼟⽤⼾的使⽤偏好。

大型語言模型的築成,有它本身的技術門檻,絕非一日之功。這也是為什么如今「打造又一 OpenAI」、「追趕 GPT-4」等言論眾多,但真正有潛力或已演化為產品級應用的成果卻相對稀缺。

能夠率先交出「天工」這份答案卷,是因為崑崙萬維對於 AI 領域的深耕在數年前就已開始。崑崙萬維從 2020 年開始佈置 AIGC 領域,「天工」⼤模型的誕⽣,也是這些年長期累積的結果。在「天工」之前,崑崙萬維已將四項百億級AIGC 模型開源,包括圖像AI“天工巧繪”、音樂AI“天工樂府”,文本AI“天工妙筆”,編程AI“天工智碼」。

崑崙萬維CEO 方漢表示,崑崙萬維旗下業務包括瀏覽器、社交娛樂、新聞、遊戲等板塊,覆蓋全球五大洲七十多個國家,和內容的關聯性都非常強,所以對內容生成方面的技術進展一直非常敏感,GPT-3 誕生後,管理層判斷這是內容生成領域的一個里程碑,從2020 年起就開始在音樂AI 領域投入。而奇點智源早在 2020 年就意識到 AI 技術在未來的應用潛力,當年就開始在大模型領域投入,並在 2021 年發布了百億級大模型。

到了 2022 年,崑崙萬維開始從音樂 AI 往多模態 AI 拓展,而只有自研千億級大模型,才能建立核心壁壘、掌握主動權。此時的奇點智源也越發強烈意識到千億級大模型是 AGI 的一個突破口,雙方一拍即合,合作自研「天工」成了一個水到渠成的選擇。 

放眼大模型賽道的未來,多模態預訓練大模型將成為必爭之地。這也是「天工」進化的必經之路。挑戰在於,圖像、影片理解所消耗的資源更多,所需的訓練卡以及訓練資源同樣更多,或許真正具備數據、演算法、算力三方面實力的玩家才能堅持到最後。

對於「天工」的未來,你有哪些期待?

以上是寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除