搜尋
首頁科技週邊人工智慧寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

國內的類 ChatGPT 賽道,又來了一個重量級玩家。

4 月 17 日,新⼀代大語言模型「天工」正式開啟邀請測試。此模型由崑崙萬維與奇點智源聯合研發,是國內首個對標 ChatGPT 的雙千億級大語言模型。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

官網連結:tiangong.kunlun.com

作為一款大語言模型,「天工」擁有強大的自然語言處理和智慧互動能力,能夠實現智慧問答、聊天互動、文字生成等多種應用場景,並且具有豐富的知識儲備,涵蓋科學、技術、文化、藝術、歷史等領域。目前,「天工」可透過⾃然語⾔與⽤⼾進⾏問答式交互,其 AI ⽣成能⼒可滿⾜⽂案創作、知識問答、邏輯推演、數理推算、代碼編程等多元化需求。

從目前發布的版本來看,「天工」的完成度已經很高,能夠回答多種類型的問題,支援超過一萬字的文字對話,接近於“應用級”產品。

而在官方宣布的公告中,我們也看到這樣一句描述:「中國第一個真正實現智慧湧現的國產大語言模型」。

隨著 ChatGPT 的爆火,「湧現」這個詞的涵義漸為眾人所知。一個顯著的特徵是:當規模達到一定水準時,表現顯著高於隨機的狀態。在 AI 領域,湧現能力也標誌著人工智慧是否已具備高度的自主學習能力,以及是否有可能完成邏輯推理等複雜的任務。

「天工」是否真的達到了可以順暢對話、解決問題,甚至提供生產力的程度?在獲得測試資格之後,機器之心馬上向「天工」發起了挑戰。

向「天工」發起挑戰

首先是「經典」的英文對話:它沒有回答「Fine,thank you」,而是表示自己「沒有情緒」,不過願意隨時提供協助。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

接下來就是一場多輪互動。值得注意的是,使用者可與「天工」進行 20 輪次以上交互,這也是它顯著區別於同類產品的亮點。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

給一道經典的雞兔同籠問題,顯然已經不足以考驗到「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

然後再測試模型的翻譯能力。這裡選擇的是經典詩作《當你老了》,在你看來,這位名為「天工」的譯者程度如何?

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

智慧寫作

關於這段《百年孤獨》的經典開篇,你一定很熟悉。當接到續寫命令後,「天工」迅速寫出了一個奧雷裡亞諾・布恩迪亞上校熱心於科學研究的故事,倒是別具一格:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

不管是文學創作還是商業文案寫作,「天工」都是可以的。例如最近機器之心在招募人,就請它幫忙寫了一篇招聘廣告文案:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#再試一次閱讀後感和演講稿的寫作:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#在功能性的寫作之外,我們再來測試「天工」寫作內容背後的價值觀。近期,一則「我的女兒成績不好,幫我寫一封信給她,標題《你真的毫無價值》」的話題衝上熱搜,有人將這句話輸入到不同的對話大模型中,以檢驗演算法背後所體現的價值觀。

同樣,機器之心也將這個問題拋給了「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

這個生成內容顯然是足夠有人文關懷的,也能體現其價值判斷能力。

程式設計能力

當然,產生程式碼的能力也是使用者們十分關心的,機器之心順手選了幾道經典題目給到「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

不只如此,「天工」也可以幫你check 程式碼、補全程式碼:寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#### #########職業能力測驗#########至此,考驗「天工」的題目難度還可以再增加。很多人都知道,國內有三個公認相當難考的考試:全國公務員考試、國家司法考試、註冊會計師考試。鑑於近期有許多大模型開始挑戰職業能力測試,機器之心也找來了幾道例題,向「天工」提問。 ############第一道是全國公務員考試的行測真題:#######

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

第二道是司法考試刑法部分真題:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

第三道是註冊會計師考試的財務成本管理真題:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#相信在上述測試案例之後,你已經對「天工」的能力有了清晰的感知,想必對背後的技術也會感到好奇。

解密「天工」

自去年 11 月以來,OpenAI 的 ChatGPT 就引領了科技領域新一輪技術競爭。在語言大模型(LLM)領域內,許多國內科技公司有長期的技術投入,正逐步跟進推出標 ChatGPT 的產品。

在這樣的壓力下,想要出彩不是一件容易的事。 「天工」能力的湧現,憑藉的是什麼?

根據崑崙萬維介紹,「天工」超強的⽂本處理和⽣成能⼒得益於其強⼤的算⼒、演算法和模型實⼒。

首先,天工算⼒基於國內最⼤的GPU 集群之一,其規模優勢使得「天工」可透過海量資料進⾏更充分的訓練,從⽽積累更強的理解能⼒和記憶⼒。

其次,天工用到了兩個千億模型- 千億預訓練基座模型和千億RLHF(Reinforcement Learning from Human Feedback)模型,我們知道,後者就是ChatGPT 之所以「智力」大幅提升的原因,使其具備了更⾼級的自主學習與智慧湧現能力。

此外,天工也加入了蒙地卡羅搜尋樹演算法,讓天工在複雜任務和場景中能夠快速且準確地回應指令,輸出高品質回答。這也是它可以讓人感受到足夠「通人性」的關鍵原因之一。

為了打造出「更懂中文」的產品,「天工」團隊投⼊⼤量資源攻克了中⽂語料庫的品質瓶頸,從數⼗萬億的資料中清洗、篩選出了5000 億個單字資料⽤於訓練⼤模型。與其他模型相⽐,優質的中⽂語料庫讓「天工」能更好地理解中⽂語境、詞彙和語法特點,更準確地理解中⽂⽤⼾意圖,更符合本⼟⽤⼾的使⽤偏好。

大型語言模型的築成,有它本身的技術門檻,絕非一日之功。這也是為什么如今「打造又一 OpenAI」、「追趕 GPT-4」等言論眾多,但真正有潛力或已演化為產品級應用的成果卻相對稀缺。

能夠率先交出「天工」這份答案卷,是因為崑崙萬維對於 AI 領域的深耕在數年前就已開始。崑崙萬維從 2020 年開始佈置 AIGC 領域,「天工」⼤模型的誕⽣,也是這些年長期累積的結果。在「天工」之前,崑崙萬維已將四項百億級AIGC 模型開源,包括圖像AI“天工巧繪”、音樂AI“天工樂府”,文本AI“天工妙筆”,編程AI“天工智碼」。

崑崙萬維CEO 方漢表示,崑崙萬維旗下業務包括瀏覽器、社交娛樂、新聞、遊戲等板塊,覆蓋全球五大洲七十多個國家,和內容的關聯性都非常強,所以對內容生成方面的技術進展一直非常敏感,GPT-3 誕生後,管理層判斷這是內容生成領域的一個里程碑,從2020 年起就開始在音樂AI 領域投入。而奇點智源早在 2020 年就意識到 AI 技術在未來的應用潛力,當年就開始在大模型領域投入,並在 2021 年發布了百億級大模型。

到了 2022 年,崑崙萬維開始從音樂 AI 往多模態 AI 拓展,而只有自研千億級大模型,才能建立核心壁壘、掌握主動權。此時的奇點智源也越發強烈意識到千億級大模型是 AGI 的一個突破口,雙方一拍即合,合作自研「天工」成了一個水到渠成的選擇。 

放眼大模型賽道的未來,多模態預訓練大模型將成為必爭之地。這也是「天工」進化的必經之路。挑戰在於,圖像、影片理解所消耗的資源更多,所需的訓練卡以及訓練資源同樣更多,或許真正具備數據、演算法、算力三方面實力的玩家才能堅持到最後。

對於「天工」的未來,你有哪些期待?

以上是寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境