搜尋
首頁科技週邊人工智慧ChatGPT-4震撼發布!準確度提高,能在SAT上能擊敗90%人類

ChatGPT-4震撼發布!準確度提高,能在SAT上能擊敗90%人類

3月15日消息,美國當地時間週二,人工智慧研究公司OpenAI發布了其下一代大型語言模型GPT-4,這是其支援ChatGPT和新必應等應用程式的最新AI大型語言模型。該公司表示,該模型在許多專業測試中的表現超出了「人類水平」。

OpenAI聲稱,ChatGPT-4比迭代前的GPT-3.5更大,這意味著它接受了更多的資料訓練,模型檔案中有更多的權重(參數),這也使得它的運行成本更高。該公司聲稱,該模型“比以往任何時候都更具創造性和協作性”,“可以更準確地解決難題”。它可以解析文字和圖像輸入,儘管它只能透過文字進行回應。

目前,該領域的許多研究人員認為,AI最近的許多進步來自於在數千台超級電腦上運行越來越大的模型,訓練過程可能耗資數千萬美元。 GPT-4就是以「擴大規模」為中心以達到更好結果的例證。

OpenAI承認,該公司使用了微軟雲端運算平台Azure來訓練其模型,微軟已經向OpenAI投資了數十億美元。 OpenAI以競爭為由,沒有公佈具體的模型大小或用於訓練它的硬體等細節,這些細節可以用來重建模型。

OpenAI的GPT大型語言模型支援許多AI演示,這些演示在過去六個月裡始終令科技行業的人們驚嘆不已,包括必應的AI聊天機器人和ChatGPT。

ChatGPT-4是對語言模型取得最新進展的預覽,這些新進展可能會在未來幾週開始向下滲透到聊天機器人等消費產品中。微軟週二表示,必應的AI聊天機器人使用GPT-4模型。

OpenAI聲稱,新模型將產生更少的事實錯誤答案,更少偏離話題,更少談論被禁止的話題,甚至在許多標準化考試中表現得比人類更好。

該公司舉例說,GPT-4在模擬律師考試中的成績在所有考生中列於前10%,在SAT閱讀考試中進入了前7%,在SAT數學考試中進入前11 %。

然而,OpenAI警告說,新模型還不夠完美,在許多情況下它的能力不如人類。例如,GPT-4仍然存在所謂的「幻覺」或編造故事等問題,而且在事實上並不可靠。當它犯錯的時候,它仍然傾向於堅持自己是正確的。 OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用時仍然能給你留下深刻印象。」

OpenAI在部落格文章中表示:「GPT-4仍有許多已知的局限性,我們正在努力解決,如社交偏見、幻覺和敵意回復等。在一次隨意的談話中, GPT-3.5和GPT-4之間的差異很小。而當任務的複雜性達到足夠的閾值時,差異就會顯現出來:GPT-4比GPT-3.5更可靠、更有創造力,並且能夠處理更多細微差別的指令。」

OpenAI表示,該公司已經與多家公司合作將GPT-4整合到他們的產品中,包括Duolingo、Stripe和Khan Academy等。這款新模型透過OpenAI每月20美元的ChatGPT訂閱服務ChatGPT Plus向用戶開放,並為微軟的必應聊天機器人提供動力。同時,GPT-4也將作為API的一部分提供,該API允許程式設計師將AI整合到自己的應用程式中。

以上是ChatGPT-4震撼發布!準確度提高,能在SAT上能擊敗90%人類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
META的新AI助手:生產力助推器還是時間下沉?META的新AI助手:生產力助推器還是時間下沉?May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

80%的Zers將嫁給AI:研究80%的Zers將嫁給AI:研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

賣給機器人:將創造或破壞業務的營銷革命賣給機器人:將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

AI如何加速再生醫學的未來AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

AI出了問題嗎?現在在那里為此保險AI出了問題嗎?現在在那里為此保險May 01, 2025 am 11:11 AM

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具