世界超大AI晶片打破單設備訓練大模型記錄，Cerebras要「殺死」GPU-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

世界超大AI晶片打破單設備訓練大模型記錄，Cerebras要「殺死」GPU

王林

Apr 25, 2023 pm 03:34 PM

晶片ai訓練

本文轉自雷鋒網，如需轉載請至雷鋒網官網申請授權。

以創造世界上最大加速器晶片CS-2 Wafer Scale Engine聞名的公司Cerebras昨日宣布他們已經在利用「巨芯」進行人工智慧訓練上走出了重要的一步。該公司訓練出了單晶片上全世界最大的NLP（自然語言處理）AI模型。

此模型具有20億個參數，並基於CS-2晶片進行訓練。這塊全世界最大的加速器晶片採用7nm製程工藝，由一整塊方形的晶圓蝕刻而成。它的大小數百倍於主流晶片，具有15KW的功率。它整合了2.6兆個7nm晶體管，封裝了850,000個核心和40GB記憶體。

世界超大AI芯片打破单设备训练大模型记录，Cerebras要「杀死」GPU

圖1 CS-2 Wafer Scale Engine晶片

單晶片訓練AI大模型新紀錄

NLP模型的開發是人工智慧中的一個重要領域。利用NLP模型，人工智慧可以「理解」文字意義，並進行相應的動作。 OpenAI的DALL.E模型就是一個典型的NLP模型。這個模型可以將使用者的輸入的文字資訊轉換為圖片輸出。

例如當使用者輸入「酪梨形狀的扶手椅」後，AI就會自動產生若干與這句話對應的影像。

世界超大AI芯片打破单设备训练大模型记录，Cerebras要「杀死」GPU

圖：AI接收訊息後產生的「酪梨形狀扶手椅」圖片

不止於此，該模型還能夠使AI理解物種、幾何、歷史時代等複雜的知識。

但要實現這一切並不容易，NLP模型的傳統開發具有極高的算力成本和技術門檻。

實際上，如果只討論數字，Cerebras開發的這一模型20億的參數量在同行的襯托下，顯得有些平平無奇。

前面提到的DALL.E模型具有120億個參數，而目前最大的模型是DeepMind於去年底推出的Gopher，具有2800億個參數。

但除去驚人的數字外，Cerebras開發的NLP還有一個巨大的突破：它降低了NLP模型的開發難度。

「巨芯」如何打敗GPU？

依照傳統流程，開發NLP模型需要開發者將巨大的NLP模型切分若干個功能部分，並將他們的工作負載分散到數百個圖形處理單元上。

數以千計的圖形處理單元對廠商來說意味著巨大的成本。

技術上的困難也同樣使廠商們痛苦不堪。

切分模型是一個客製化的問題，每個神經網路、每個GPU的規格、以及將他們連接（或互聯）在一起的網路都是獨一無二的，並且不能跨系統移植。

廠商必須在第一次訓練前將這些因素統統考慮清楚。

這項工作極為複雜，有時甚至需要幾個月的時間才能完成。

Cerebras表示這是NLP模型訓練中「最痛苦的方面之一」。只有極少數公司擁有開發NLP所必要的資源和專業知識。對於人工智慧產業中的其他公司而言，NLP的訓練則太昂貴、太耗時且無法使用。

但如果單一晶片就能夠支援20億個參數的模型，就意味著不需要使用海量的GPU分散訓練模型的工作量。這可以為廠商節省數千個GPU的訓練成本和相關的硬體、擴展要求。同時這也使廠商不必經歷切分模型並將其工作負載分配給數千個GPU的痛苦。

Cerebras也並非只執拗於數字，評價一個模型的好壞，參數的數量並不是唯一標準。

比起希望誕生於“巨芯”上的模型“努力”，Cerebras更希望的是模型“聰明”。

之所以Cerebras能夠在參數量上取得爆炸性成長，是因為利用了權重流技術。這項技術可以將計算和記憶體的佔用量解耦，並允許將記憶體擴展到足以儲存AI工作負載中增加的任何數量的參數。

由於這項突破，設定模型的時間從幾個月減少到了幾分鐘。並且開發者在GPT-J和GPT-Neo等型號之間「只需幾次按鍵」即可完成切換。這讓NLP的開發變得更簡單。

這使得NLP領域出現了新的變化。

正如Intersect360 Research 首席研究官Dan Olds 對Cerebras取得成就的評價：「Cerebras 能夠以具有成本效益、易於訪問的方式將大型語言模型帶給大眾，這為人工智能開闢了一個激動人心的新時代。

以上是世界超大AI晶片打破單設備訓練大模型記錄，Cerebras要「殺死」GPU的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

易於理解的解釋如何在Chatgpt中建立兩步身份驗證！May 12, 2025 pm 05:37 PM

CHATGPT SECURICE增強：兩階段身份驗證（2FA）配置指南需要兩因素身份驗證（2FA）作為在線平台的安全措施。本文將以易於理解的方式解釋2FA設置過程及其在CHATGPT中的重要性。這是為那些想要安全使用chatgpt的人提供的指南。單擊此處獲取OpenAI最新的AI代理OpenAi Deep Research⬇️ [chatgpt]什麼是Openai深入研究？關於如何使用它和費用結構的詳盡解釋！目錄 chatg

[針對企業] Chatgpt培訓|對8種免費培訓選項，補貼和示例進行了詳盡的介紹！May 12, 2025 pm 05:35 PM

生成的AI的使用吸引了人們的關注，這是提高業務效率和創造新業務的關鍵。特別是，由於其多功能性和準確性，許多公司都採用了Openai的Chatgpt。但是，可以有效利用chatgpt的人員短缺是實施它的主要挑戰。在本文中，我們將解釋“ ChatGpt培訓”的必要性和有效性，以確保在公司中成功使用Chatgpt。我們將介紹廣泛的主題，從ChatGpt的基礎到業務使用，特定的培訓計劃以及如何選擇它們。 CHATGPT培訓提高員工技能

關於如何使用Chatgpt簡化您的Twitter操作的詳盡解釋！May 12, 2025 pm 05:34 PM

社交媒體運營的提高效率和質量至關重要。特別是在實時重要的平台上，例如Twitter，需要連續交付及時和引人入勝的內容。在本文中，我們將解釋如何使用具有先進自然語言處理能力的AI的Chatgpt操作Twitter。通過使用CHATGPT，您不僅可以提高實時響應功能並提高內容創建的效率，而且還可以製定符合趨勢的營銷策略。此外，使用預防措施

[對於Mac]說明如何開始以及如何使用ChatGpt桌面應用程序！May 12, 2025 pm 05:33 PM

CHATGPT MAC桌面應用程序詳細指南：從安裝到音頻功能最後，Chatgpt的Mac桌面應用程序現已可用！在本文中，我們將徹底解釋從安裝方法到有用的功能和將來的更新信息的所有內容。使用桌面應用程序獨有的功能，例如快捷鍵，圖像識別和語音模式，以極大地提高您的業務效率！安裝桌面應用的ChatGpt Mac版本從瀏覽器訪問：首先，在瀏覽器中訪問chatgpt。

chatgpt的角色限制是什麼？解釋如何避免它和模型上限May 12, 2025 pm 05:32 PM

當使用chatgpt時，您是否曾經有過這樣的經驗，例如“輸出在中途停止”或“即使我指定了字符的數量，它也無法正確輸出”？該模型非常開創性，不僅允許自然對話，而且還允許創建電子郵件，摘要論文，甚至允許產生諸如小說之類的創意句子。但是，ChatGpt的弱點之一是，如果文本太長，輸入和輸出將無法正常工作。 Openai的最新AI代理“ Openai Deep Research”

什麼是Chatgpt的語音輸入和語音對話功能？解釋如何設置以及如何使用它May 12, 2025 pm 05:27 PM

Chatgpt是Openai開發的創新AI聊天機器人。它不僅具有文本輸入，而且還具有語音輸入和語音對話功能，從而可以進行更自然的交流。在本文中，我們將解釋如何設置和使用Chatgpt的語音輸入和語音對話功能。即使您不能脫身，Chatp Plans也通過與您交談來做出回應並回應音頻，這在繁忙的商業情況和英語對話練習等各種情況下都帶來了很大的好處。關於如何設置智能手機應用程序和PC的詳細說明以及如何使用。

易於理解的解釋如何使用Chatgpt進行求職和尋找工作！May 12, 2025 pm 05:26 PM

成功的快捷方式！使用chatgpt有效的工作變更策略在當今加劇的工作變更市場中，有效的信息收集和徹底的準備是成功的關鍵。諸如Chatgpt之類的高級語言模型是求職者的強大武器。在本文中，我們將解釋如何有效利用Chatgpt來提高您的工作企業效率，從自我分析到申請文件和麵試準備。節省時間和學習技術，以充分展示您的優勢，並幫助您成功搜索工作。目錄使用chatgpt的狩獵工作示例自我分析的效率：聊天

易於理解的解釋如何使用ChatGpt創建和輸出思維地圖！May 12, 2025 pm 05:22 PM

思維地圖是組織信息並提出想法的有用工具，但是創建它們可能需要時間。使用Chatgpt可以大大簡化此過程。本文將詳細說明如何使用chatgpt輕鬆創建思維地圖。此外，通過創建的實際示例，我們將介紹如何在各種主題上使用思維圖。了解如何使用Chatgpt有效地組織和可視化您的想法和信息。 Openai的最新AI代理OpenA

See all articles