1956 年,在達特茅斯學院召開的研討會上,人工智慧這個概念正式被提出。
之後這個字一直挑戰著心理學家、哲學家和電腦科學家,因為它太難被定義了。 1994 年,52 名心理學家聯合發文試圖捕捉它的本質。
隨著時間的推移,研究者開始將注意力轉移到特定領域的 AI 系統,如 2016 年 AlphaGo 挑戰韓國冠軍棋手大獲全勝。之後,時間來到 20 世紀 90 年代末和 21 世紀初,研究者不滿足於專用 AI,因此開發更通用的人工智慧系統呼聲越來越高。隨之而來的是,通用人工智慧 (AGI) 一詞開始在 2000 年代初期流行起來。
最近一段時間,如大家所見,大型語言模型 (LLM) 走到聚光燈下,這些神經網路基於 Transformer 架構,並在大量文字資料集上訓練而成。尤其是 OpenAI 最新發布的 GPT-4,更是展示了大型語言模型的通用性,在數學、文字、法律、醫學等領域樣樣精通。
我們不禁會問,GPT-4 是邁向 AGI 的重要一步嗎?
微軟給出的答案是肯定的,在其最近發布的一篇論文中,他們闡述了這個觀點。文中對 GPT-4 進行了全面評測。微軟認為「鑑於GPT-4 能力的廣度和深度,我們相信它應該被合理地視為一個通用人工智慧(AGI)系統的早期(但仍不完整)版本。」
微軟也表示,「本文的主要目標是對GPT-4 的能力和局限性進行探索,我們相信GPT-4 的智慧標誌著電腦科學及其他領域的真正範式轉變。」
論文網址:https://arxiv.org/pdf/2303.12712.pdf
有趣的是,這篇火爆的論文還被發現有大量刪減,因此有人找出了未刪節版論文。
從未刪減版本中,這個部落客也扒出了大量隱藏的細節,如GPT-4 的內部名稱為DV-3,實際上也是該論文的隱藏第三作者,後來被刪除;這些微軟的研究人員對GPT-4 的技術細節似乎了解也不多。此外部落客也透露這篇論文發佈時刪除了有關毒性內容的部分(防止對 OpenAI 造成負面?)。
我們在下面貼上了該部落客的 Twitter 線程,感興趣的可以查看。
Twitter thread:https://twitter.com/DV2559106965076/status/1638769434763608064
#回到文章本身。
根據文章所認定的 AGI,是具體的擁有推理、計劃、解決問題、抽象思維、理解複雜思想、快速學習和從經驗中學習的能力。從這些能力出發,論文進行了有趣的實驗和評測。
論文分為10 個章節:第一章為總括部分;第二章介紹了多模態,主要和視覺生成內容相關;第三章代碼,根據指令生成代碼、理解現有代碼;第四章數學能力;第五章與世界的交互作用;第六章與人類的交互作用;第七章判別力;第八章GPT-4 限制;第九章社會影響;第十章未來方向及結論。
下面我們透過具體的範例,看看 GPT-4 是不是真的邁進了 AGI 時代。
多模態和跨學科組成
為了測試模型將藝術與程式設計結合的能力,研究要求GPT-4 用javascript 寫一段程式碼,以產生康丁斯基風格的隨機影像,下圖第一張為Wassily Kandinsky 創作的,第二張和第三張分別由GPT-4 和ChatGPT 產生的:
#下面為GPT-4 程式碼實作過程:
# #進行視覺概念理解:在這個作圖任務中, 輸入提示讓模型結合字母Y、O、H 的形狀來畫一個人。其實在GPT-4 的訓練過程從沒有關於字母形狀的認識,只能從相關訓練資料中、模糊地學習到字母與一些特定形狀有關,結果顯示GPT-4 產生的結果還不錯:
用於草圖產生:GPT-4 也能與Stable Diffusion 結合。下圖為 3D 城市建模截圖,輸入提示有一條河流從左到右流淌、河的旁邊建有金字塔的沙漠、螢幕底部有 4 個按鈕,顏色分別為綠色、藍色、棕色和紅色。以下是生成結果:
你還能要求GPT-4 用ABC 記譜法產生和修改曲調:
GPT-4 有非常強大的程式設計能力,包括根據指令編寫程式碼和理解現有程式碼。該研究具體測試了 GPT-4 在程式設計方面的能力。
程式編寫
#下圖3.1 是一個讓GPT-4 寫python 函數的例子,該研究使用LeetCode 在線判斷代碼是否正確。
然後,研究讓GPT-4 將上表2 中LeetCode 上的準確率資料視覺化為圖表,結果如下圖3.2 所示。
#如下圖3.3 所示,研究讓GPT-4 用JavaScript 在HTML 中編寫3D 遊戲,GPT-4 在零樣本的情況下產生了一個符合所有要求的遊戲。
深度學習程式設計
#為深度學習編寫程式碼需要數學、統計學知識,並熟悉PyTorch、TensorFlow、Keras 等框架和函式庫。如下圖 3.4 所示,研究者要求 GPT-4 和 ChatGPT 編寫自訂優化器模組,該任務對於人類深度學習專家來說也是具有挑戰性的。研究者為 GPT-4 和 ChatGPT 提供了自然語言描述,其中包括一系列重要的操作,例如應用 SVD 等等。
在理解程式碼方面,研究嘗試讓GPT-4 和ChatGPT「讀懂」一段C/C 程序,並預測程式的輸出結果,二者的表現如下:
然後,研究讓GPT-4 解釋了一段Python 程式碼:
##還有解釋一段偽代碼:
一直以來,大型語言模型的數學能力似乎一直不是很好。那麼 GPT-4 在這方面表現如何呢?本文經過一系列評測,結果顯示 GPT-4 相比以前的模型在數學方面有了質的飛越,但是離專家水平還差得很遠,不具備數學研究的能力。
在與ChatGPT 的對比中, GPT-4 成功的產生了解決方案,而ChatGPT 產生了錯誤答案:
在AP 題目上,GPT-4 vs ChatGPT 比較結果。 GPT-4 使用了正確的方法,不過因為計算錯誤導致最終答案錯誤,而 ChatGPT 產生了一個不連貫的論點。
此外,本文也測試了GPT-4 使用數學思維和技術來解決現實問題的能力:下圖展示了GPT-4 如何成功地為一個需要廣泛跨學科知識的複雜系統建立合理的數學模型,而ChatGPT 未能取得有意義的進展。
以上是做完GPT-4完整測評,微軟爆火論文說初版AGI快來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

禪工作室 13.0.1
強大的PHP整合開發環境

WebStorm Mac版
好用的JavaScript開發工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 Linux新版
SublimeText3 Linux最新版

記事本++7.3.1
好用且免費的程式碼編輯器