搜尋
首頁科技週邊人工智慧重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

就在剛剛,根據The Information的最新爆料,OpenAI即將發布一款全新的開源大語言模型。

雖然目前還不清楚,OpenAI是否打算利用即將開源的模型,來搶佔Vicuna或其他開源模型的市場份額。

但幾乎可以肯定的是,新模型的能力大機率無法與GPT-4甚至GPT-3.5競爭。

畢竟,270億美元的估值也決定了,OpenAI最先進的模型將會被用於商業目的,儘管前兩個版本的GPT都是開源的。

對此,OpenAI的發言人沒有回應置評請求。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

羊駝家族開源大爆發

十天前,Google的內部文件洩漏。在這篇名為《我們沒有護城河,OpenAI也沒有》的文章裡,作者沉痛控訴了開源對於Google和OpenAI的沉重打擊。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

的確,在這次軍備競賽中,Google和OpenAI似乎都不是贏家,因為開源社群正在吃掉屬於它們的「利益」 。

ChatGPT一出,引爆了全球的LLM革命。然而,OpenAI不Open,很多公司和開發者只能看著乾著急。

此時,Meta站出來發布了LLaMA,為全世界開發者謀了一把福利。

本來呢,Meta承諾的是LLaMA會對非商用的研究用例開源,可是誰能想到,僅在發布一周後,LLaMA的權重忽然在4chan上洩漏了,瞬間就引發了數千次下載。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

這場「史詩級洩漏」,直接讓開源LLM領域變了天。短短幾週內,各種ChatGPT平替就以迅雷不及掩耳之勢呈現爆炸性成長。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat……簡直堪稱是「羊駝家族」大爆炸。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

其實,早在羊駝之前,開源模型就曾經破滅過OpenAI的野心。

當時,剛發表的Dall-E 2憑藉著驚豔的文生圖效果,在網路上引起了不小的轟動。

然而,當OpenAI還在試圖兜售API時,一款開源替代突然橫空出世-Stable Diffusion。

隨著Stable Diffusion的快速崛起,Dall-E 2也很快就被開發者們拋在腦後了。

開源大模型,要顛覆矽谷大廠?

UC Berkeley的電腦教授Ion Stoica正是使用Meta的研究開發Vicuna的學者之一。

為了提高Vicuna的能力,Stoica和同事們正在努力增加模型中的計算數量,這將有助於處理涉及推理的任務,例如寫程式碼。

開發Vicuna的是一個柏克萊的團隊,每年的預算為數百萬美元,其中約50萬美元來自包括微軟、Google和亞馬遜在內的上市公司。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

#

UC Berkeley的電腦教授Ion Stoica表示,現在的免費AI模型,在性能上已經「相當接近」谷歌和OpenAI的專有模型了,毫無疑問,大多數開發者最終都會選擇免費模型。

一方面,開源模型可以讓開發者使用自己的資料來解決特定的問題。

另一方面,像Vicuna這種模型的訓練成本甚至可以低至幾百美元,而且還不用向大廠支付昂貴的使用費。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

https://www.php.cn/link/4d8bd3f7351f4fee76ba17594f070ddd

#如果Stoica的看法正確,開源AI必將顛覆Google、OpenAI、微軟等出售專有模型使用權的大廠的商業計劃。

Vicuna的品質和開源AI的寒武紀大爆發,讓Google工程師Luke Sernau警告同事,Google在努力追趕OpenAI時,太過關注專有軟體了。

如果免費、高品質的平替沒有使用限制,誰會去付費使用帶有條條框框的Google產品呢?開源AI的發展正在超越我們,Google應該在開源社群中建立自己的領導地位,並放棄對我們模型的部分控制。

這份備忘錄迅速在整個產業中引起了共鳴——即使Sernau或許高估了開源AI的能力,低估了它們的成本和風險,但大多數從業者都同意,Meta非常有可能從中獲益。

例如,Meta在內部會使用AI模型進行內容推薦和廣告定位,當開發者改進Meta的模型時,Meta就可以把這些改進納入自己內部的AI。

Meta CEO小札對此籌謀已久。

4月,在他與分析師的一次電話會議中,他曾這樣談到公司的策略—

如果產業能夠在我們使用的基礎工具上達成標準化,那麼我們就能從其他人的改進中受益,這樣會更好。

Google倒是沒有完全採用專有的方式來處理AI軟體。

早在2020年,Google就發布了一個開源語言模型T5,讓開發者可以建立能夠執行翻譯和摘要任務的軟體。隨後,Google又發布了一個更先進的Flan-T5。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

但是,根據Stoica和其他從業者的說法,Meta發布的軟體能夠在谷歌模型的基礎上做出顯著改進,這讓開發者選擇Meta模型的可能性大大增加了。

不過,Stoica表示,Google在開源軟體方面仍有兩個優勢。

1. 如果Google利用其不向外部開放的用戶數據,模型在某些專業領域(如內容推薦)的表現可能會更好。

不過,Google發言人表示,公司並沒有在現有用戶資料上訓練其基礎模型。

2. 搜尋公司在管理大規模電腦基礎設施方面的專長,意味著它能夠以更低的成本來運行模型,包括為雲端客戶提供服務。

同時,OpenAI在收集數百萬人與ChatGPT互動方式的資料上,已經搶得了先機,這會更有助於OpenAI改進AI軟體,更不用提它和微軟的合作協定.

開源的繁榮,是大廠的「施捨」?

不過,這種建立在開源基礎上的繁榮,是不穩定的。

目前大多數的開源,仍然依賴資金雄厚的大公司發布的巨型模型。如果OpenAI和Meta決定關閉業務,繁榮的開源社區,可能就會變得蕭條。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?


例如,現在許多開源平替是基於Meta的LLaMA建構的。

而其他模型使用的是名為Pile的大型公共資料集,由開源非營利組織EleutherAI整理。

EleutherAI之所以存在,是因為OpenAI的開放性意味著一群開發者能夠逆向了解GPT-3是如何製作的,然後在空閒時間裡創建自己的模型。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

但一切都可能改變。

OpenAI不再Open,Meta也在考慮限制開源,防止新創公司利用開源程式碼做壞事。

Meta AI的執行董事Joelle Pineau表示,現在向外部人員開放代碼是正確,但他並不確定,在未來五年內Meta還會採用相同的策略。

如果這種Close的趨勢持續下去,那麼不僅開源社群會被拋棄,下一代的AI突破也會重新回到那些最大、最不差錢的AI實驗室手中。

顯然,AI大模型的製造和使用方式的未來,正處於一個十字路口。

如果OpenAI曾經吝嗇,就不會有如今的開源盛況

其他人也在權衡,這種開源的自由競爭帶來的回報更大,還是風險更大。

就在Meta AI發布LLaMA的同時,Hugging Face推出了一個門禁機制,下載平台上的模型之前,用戶必須申請訪問並獲得批准,這是為了限制那些有合法理由的人。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

「我並不是一個開源的佈道者,」Hugging Face的首席倫理科學家Margaret Mitchell說。 「我能看到不開源的意義。」

大模型廣泛使用的一個弊端,就是可能造成AI色情產品的氾濫。

Mitchell曾在Google工作,並創立了AI道德團隊,她對於模型被濫用的風險十分了解。因此,她贊成Meta AI以有控制的方式發布模型。

同時,OpenAI也在關閉水龍頭。 GPT-4發佈時,並未公佈架構(包括模型大小)、硬體、訓練計算、資料集建置、訓練方法等細節,理由是「鑑於像GPT-4這樣的大規模模型的競爭格局和安全影響」 。

這種限制反應了OpenAI心態上的變化。共同創辦人兼首席科學家Ilya Sutskever表示,OpenAI過去的開放性是個錯誤。

OpenAI的政策研究員Sandhini Agarwal說:「以前,如果某樣東西是開源的,也許一小群修理工會關心。但現在,整個環境已經改變。開源真的可以加速發展,導致競爭。」

時間倒回三年前,如果OpenAI在公佈GPT-3的細節時,就秉持著同樣的原則,那就不會有EleutherAI的出現,也就不會有蓬勃的開源創新。

今天,EleutherAI在開源生態系統中發揮著舉足輕重的作用。 Pile被用來訓練多個開源項目,包括Stability AI的StableLM。

重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?

但隨著GPT-4、5、6被鎖死,開源社群可能會再次被落在幾家大公司後面。

他們會被困在上一代模型中,如果想取得進步,只能閉門造車。

以上是重磅內幕:OpenAI即將開源新模型!開源社群的繁榮,全靠大廠「施捨」?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中