再一次改變「AI」世界 GPT-4千呼萬喚始出來-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

再一次改變「AI」世界 GPT-4千呼萬喚始出來

PHPz

Apr 10, 2023 pm 02:40 PM

chatgptgpt-4

再一次改變「AI」世界 GPT-4千呼萬喚始出來

近來一段時間，人工智慧聊天機器人ChatGPT刷爆網絡，網友們爭先恐後去領略它的超高情商和巨大威力。參加高考、修改程式碼、構思小說……它在廣大網友的「鞭策」下不斷突破自我，甚至可以用一整段程序，為你拼接出一隻小狗。而這些技能只是基於GPT-3.5開發而來，在3月15日，AI世界再次更新，最新版本的GPT-4也被OpenAI發布了出來。

與之前相比，GPT-4不僅展現了更強大的語言理解能力，還能夠處理圖像內容，在考試中的得分甚至能超越90%的人類。那麼，如此「逆天」的GPT-4還具有哪些能力呢？它又是如何煉成的呢？

「逆天」的GPT-4

在發布了GPT-4後，OpenAI官網一度發生擁堵，許多用戶在社群媒體裡面表示他們立刻訂閱了Plus服務。 GPT-4在發布後，「GPT-4」這一詞條迅速登上美國、日本等地區熱榜，也登上了國內的微博熱搜榜、抖音熱榜社會榜等。

根據OpenAI官方介紹，GPT-4是一個大型的多模式模型，可以接收圖像和文字輸入，輸出文字。雖然它在許多現實世界場景中的能力不如人類，但在各種專業和學術基準上表現出人類水平的表現。例如GPT-4可以透過模擬SAT(美國學術能力評估測驗)，並且取得前10%的成績，而GPT-3.5的成績則在最後10%之列。

再一次改变“AI”世界 GPT-4千呼万唤始出来

我們看到，在官方演示影片中，Open AI總裁兼聯合創始人Greg Brockman也讓用戶先睹為快，了解最新版系統的圖像識別功能，該系統尚未公開，僅由一家名為Be My Eyes的公司測試。此功能將允許 GPT-4 分析和回應與提示一起提交的影像，並根據這些影像回答問題或執行任務。「GPT-4 不僅僅是一種語言模型，它還是一種視覺模型，」Brockman表示，「它可以靈活地接受任意穿插圖像和文字的輸入，有點像文檔。」

在演示的另一個時刻，Greg Brockman向GPT-4提交了一張手繪和初步網站草圖的照片，系統創建了一個工作基於繪圖的網站。

再一次改变“AI”世界 GPT-4千呼万唤始出来

業界認為，ChatGPT-4比GPT-3強大571倍，最受益於此最新成果的三大職業就是作家、行銷人員和創業家。根據對兩者比較，業界人士還指出GPT-4的其他優勢，如訓練資料更多、答覆更加多樣性和有創意性以及反應所需時長更短，一秒即可。

再一次改变“AI”世界 GPT-4千呼万唤始出来

我們認為，這種升級體現的一個主要趨勢就是多模態，模型變得更加複雜龐大，可以將不同類型的資料放入同一模型，對我們週邊的環境和真實世界做出更好的理解。

此外，在多語言方面，GPT-4也體現出優越性。在測試的26種語言中，GPT-4在24種語言的表現均優於GPT-3.5等其他大語言模型的英語語言表現，其中包括部分低資源語言如拉脫維亞語、威爾斯語等。在中文語境中，GPT-4能夠達到80.1%的準確性。

不過，OpenAI也在官方網站上給出了GPT-4存在的不足，其仍然存在包括社會偏見、捏造事實、對抗生成等已知限制。 OpenAI對此表示，隨著社會對AI模型的接受，將增加透明度，鼓勵並促進用戶教育和更廣泛的人工智慧素養，並致力於擴大人們在培養AI模型方面的輸入途徑。

GPT-4可以商業化了

隨著GPT-4的發展，我們發現它的能力雖然在許多現實場景中不如人類，但在各種專業和學術基準測試中表現出了與人類相當的水平，這也意味著，GPT-4確實在商業化上更進一步了。

先前，GPT-3在專業領域的表現一直被人們認為差強人意，在美國的律師資格考試Uniform Bar Exam (MBE MEE MPT)中，GPT-3.5只能排在倒數10%，而GPT-4的成績已經可以排到前10%。 GPT-4在專業領域的能力實現了巨大提升，在一些專業領域已經開始逐漸接近甚至超過人類，這給GPT-4在許多ToB商業領域提供了更多可能性。

例如專業技能輔助工具，知識檢索類別的應用，職業教培輔導等領域，GPT-4帶來的能力可能將會是革命性的。

GPT-4發布之後，微軟在第一時間表示：「如果你在過去五週內的任何時候使用過新的Bing預覽版，你就已經提前了解了OpenAI最新模型的強大功能」。這表示New Bing早已經用上了GPT-4，在過去幾週，很多人體驗的必應就是GPT-4加強過的，僅僅開放使用了文字能力而已。雖然微軟沒有用全球首發的字眼來描述，畢竟微軟在OpenAPI上已經投入了130億美元(約合人民幣900億元)，換來的這樣的待遇也是情理之中。

除了微軟的New Bing外，目前還有多家公司將GPT-4搭載到他們的產品中，包括語言學習工具軟體多鄰國(Duolingo)、幫助視障用戶的軟體BeMyEyes、行動支付公司Stripe、國際性金融服務公司摩根士丹利等。

但不得不承認的是，雖然GPT-4大幅拓寬了大模型可能落地的商業化場景，但算力、研發成本，仍被許多人認為是大模型落地過程中很難跨過的障礙。畢竟大模型的研發、算力支出在目前看來高得嚇人，此前ChatGPT公開的單次訓練、日常營運開支都是以百萬美元為單位的，短期內想要商用可能很難控製成本。

GPT發展史

眾所周知，ChatGPT是OpenAI公司研發的一個大型自然語言處理模型，但很多人不知道，它的發展歷程可以追溯到2015年。 2015年，OpenAI由特斯拉的馬斯克、Sam Altman及其他投資者共同創立，旨在透過先進的人工智慧技術推動人工智慧領域的發展。而馬斯克則在2018年時因公司發展方向分歧而離開。

先前，OpenAI因推出 GPT系列自然語言處理模式而聞名。從2018年起，OpenAI就開始發布生成式預訓練語言模型GPT(Generative Pre-trained Transformer)，可用於產生文章、程式碼、機器翻譯、問答等各類內容。

每一代GPT模型的參數量都爆炸式增長，2019年2月發布的GPT-2參數量為15億，在2020年5月，當OpenAI發布了GPT-3，它已經是世界上最先進的自然語言生成模式。 GPT-3具有1750億個參數。

GPT-3出現時，作為一個無監督模型(現在經常被稱為自監督模型)，幾乎可以完成自然語言處理的絕大部分任務，例如面向問題的搜尋、閱讀理解、語義推論、機器翻譯、文章產生和自動問答等等。

而且，該模型在諸多任務上表現卓越，例如在法語-英語和德語-英語機器翻譯任務上達到當前最佳水平，自動產生的文章幾乎讓人無法辨別出自人還是機器，更令人驚訝的是在兩位數的加減運算任務上達到幾乎100%的正確率，甚至還可以依據任務描述自動產生程式碼。一個無監督模型功能多效果好，似乎讓人看到了通用人工智慧的希望，也許這就是GPT-3影響如此之大的主要原因。

2021年，OpenAI宣布將推出一個新的名稱，名為「DALL-E"，這是一種能夠產生影像的人工智慧技術。同時，OpenAI也在研發更先進的自然語言處理技術。

此後的故事相信大家都很清楚了，2022年底基於GPT-3.5的ChatGPT以光速席捲全球，成為全球最大的“科技明細”，直到現在GPT-4的發布更是登上多國熱搜。

再一次改变“AI”世界 GPT-4千呼万唤始出来