ChatGPT大火帶動AI又一波熱潮,不過業界普遍認為,當AI 步入大模型時代,只有大企業和超級富有的企業才玩得起AI,因為AI大模型的打造非常昂貴。
首先是計算昂貴。 多倫多大學行銷教授Avi Goldfarb說:“如果你想創辦一家企業,自己開發大語言模型,自己計算,成本太高了。OpenAI是很貴的,要數以十億計的美元。”租賃計算當然會便宜不少,但企業還是要向AWS等企業支付昂貴費用。
其次是資料昂貴。 訓練模型需要大量數據,有時數據是現成的,有時不是。 Common Crawl和LAION等數據可以免費使用,對於此類數據,成本主要來自數據清理和處理,成本變化很大,可能是幾百美元,也可能是數百萬美元。
Glean公司創始工程師Debarghya Das說,在美國,根據大語言模型論文做一些粗略的數學計算,如果用的是Facebook LLaMA,訓練成本(不考慮迭代或出錯)大約是400萬美元,如果是谷歌PaLM,大約2700萬美元。
即使用的是免費數據,成本也不低。 Hugging Face公司研究人員Sasha Luccioni說:「當你下載容量達到TB的數據,如果想過濾或以某種特殊方式利用數據,例如用文字-圖片模型處理(研究人會專注於某些數據子集,這樣模型才會變得更好),整個過程相當棘手。」需要強大的計算力,需要大量專業人士。
再次,專業人才的聘請費用也很高。 Debarghya Das在做上述估算成本時沒有考慮人力成本。 Sasha Luccioni指出:「機器學習專業人士的薪酬很高,因為要與Google及其它科技巨頭爭奪人才,有時一位專業人才可能要幾百萬美元。」2016年OpenAI最頂尖的研究人員薪酬約為190萬美元。
並且,訓練模型、聘請專業人士的成本不是一次性的,是持續的。 例如,如果開發的是客服聊天機器人,每週或每幾週就要優化。模型也要經受壓力測試,確保它產生的答案不會出錯。正如Sasha Luccioni所解釋:「最昂貴的成本來自持續性工作,必須持續測試模型,必須確保AI所做的和預期一樣。」
最後,持續運作費用也不低。 當一切準備妥當,模型向公眾開放,每天要接受成千上萬次詢問,此時要確保模型可擴展、高度穩定,維護成本也很高,且需要專業人士來處理。
以上是AI大模型非常昂貴 只有大企業和超級富豪才能玩得轉的詳細內容。更多資訊請關注PHP中文網其他相關文章!