搜尋
首頁科技週邊人工智慧AI大牛李沐裝機影片來了!你也能練100億的大模型

AI大牛李沐裝機影片來了!你也能練100億的大模型

在還沒出裝機影片前,李沐老師曾發起了一個小小的問卷調查,趁著顯卡降價,看下童鞋們對裝機跑Transformer有多大興趣。

當時,就連華為天才少年「稚暉君」都來點讚了,足見大家還是很期待的。

AI大牛李沐裝機影片來了!你也能練100億的大模型

這不,沐神帶著他的裝置影片來了。怎樣用最低的成本訓練一個100億模型?

而就在最近,幣圈也在一直降溫,同時GPU也明顯降價了不少,就例如英偉達3090TI現在售價1600美元(原價2000美元)。

AI大牛李沐裝機影片來了!你也能練100億的大模型

在這個專案的開始,先裝了2台原型機,每台機器都是雙卡RTX 3090TI ,採用了水冷散熱系統,減少了噪音。

一台機器裝下來,造價有5000多美元,大約3萬5人民幣。

話不多說,來看看沐神如何裝機的吧~

##裝機清單

裝機的需求,首先就要夠安靜。不然太吵的話沒辦法工作。

第二個需求就是散熱要好。不然溫度過高的話會導致GPU降頻。

第三個,重點來了,因為要跑比較大的Transformer模型,所以GPU的頻寬必須夠好。

如果之前裝過GPU伺服器用來跑CNN的話,跟跑Transformer模型的需求會不太一樣。因為Transformer模型比CNN模型更大,對記憶體的佔有率會更高。所以GPU的記憶體大小非常重要。

AI大牛李沐裝機影片來了!你也能練100億的大模型

之前沐神也講過,要把這樣大的Transformer模型放到多個GPU上訓練,來自Google、微軟等的工程師都是用類似DGA X100這樣的機器來跑的。即使在這樣的機器上,GPU的頻寬仍然是一個瓶頸。

購買這種伺服器GPU和遊戲GPU的差別就在於,前者不在於單卡能跑得多快,而是卡片與卡片之間能夠多快地連接出來。

因此裝機概念的重點是:盡量增大GPU內存,以及GPU之間互聯的一個頻寬,

如果一台機器想放很多卡的話,就要買渦輪的散熱。

如果想要安靜的話,就買水冷的散熱,沐神買的是4塊3090 TI。用水冷的好處是比較安靜,壞處就是特別佔地方。

所以,如果要在機殼上放四張卡片的話,就不要買水冷的版本,而是要買只有一個渦輪風扇的版本。

而且機殼裡風的流向是一個特別重要的問題。如果買有3個風扇的卡,風是從正面進入機箱,然後從四面八方散熱,卡挨得緊的話,機殼裡的溫度就會非常高。

沐神也說,自己在多年前,買了四塊2個大風扇的卡片放在一起,結果就導致一塊卡溫度過高燒掉了。 #

GPU選好以後(華碩的ROG), 剩下的配置就比較簡單。 CPU用的是AMD的12核心CPU,主機板是號稱PCIE 4.0 16的某牌子,硬碟是2 TB的M.2的硬碟,風扇是120毫米水冷風扇,加一個全尺寸機箱。

AI大牛李沐裝機影片來了!你也能練100億的大模型

裝機步驟

#裝機清單完成後,接下來就是具體的裝​​置過程了。步驟如下:

先放置GPU。注意,放的過程中一定不能用手碰金屬的地方,如果有靜電的話非常容易造成GPU導電。

AI大牛李沐裝機影片來了!你也能練100億的大模型

把GPU放進去之後,把螺絲擰上。然後把風扇裝進去。

插上電源後,把電源線和水管線綁在一起。然後把NVLink的橋接連上去。

AI大牛李沐裝機影片來了!你也能練100億的大模型

最後連上電源,機器就可以運作了。

AI大牛李沐裝機影片來了!你也能練100億的大模型

壓力測試

#在裝置完成後,下一步的任務就是繼續裝上作業系統。

沐神裝的是ubuntu22,裝上之後就靠遠端連上去了。

當然了,沐神也是把各種情​​況說的比較詳細,除了ubuntu22以外,windows和linux在不同的需求下也是可以的。

這裡沐神用的SSH進行的遠端連線。

AI大牛李沐裝機影片來了!你也能練100億的大模型

沐神的系統已經裝上了驅動,同時,他也指出如果還沒有驅動的話,也可以用apt-get裝上nvidia-driver-515。

AI大牛李沐裝機影片來了!你也能練100億的大模型

裝好之後,就可以執行nvidia-smi,看到系統了。

AI大牛李沐裝機影片來了!你也能練100億的大模型

從中可以看到各項資訊。例如GPU的數量、溫度、瓦數、記憶體使用等等。

接下來還可以透過nvidia-smi的topo-m矩陣看到nv-link是否正常。

AI大牛李沐裝機影片來了!你也能練100億的大模型

可以看到兩個GPU由NV4連接。 4表示4個頻道,這代表連線是正常的。

下一題,是測試系統在滿載的情況下的溫度。

沐神表示,測試GPU的是一個叫gpu-burn的小程序,github上可以下載。

這裡沐神模擬跑了十分鐘,也是看到了兩個GPU的溫度。沐神還打趣說,都能感覺到GPU在呼呼吹熱風。

#

同理,CPU也可以用這種方法測試溫度,用的是cpu-burn。

最終兩個GPU的溫度停留在58度和55度,功耗拉到了440多瓦(滿功耗480瓦),還挺好的。

最後的一項參數是機器的耗電情況。沐神的測試大概用了1240瓦,意味著每小時用電1.5度。

AI大牛李沐裝機影片來了!你也能練100億的大模型

從目前的資料來看,穩定性還ok。

至於用這台機器跑Transformer效能怎麼樣,還得等下期影片了。

網友熱評

影片發出後,b站的網友也表示出了極大的興趣。

有滿分課程代表同學出沒,列出了影片中提到的完整配置清單。 AI大牛李沐裝機影片來了!你也能練100億的大模型

還有網友火速前來圍觀,「跟李沐學裝機」。

AI大牛李沐裝機影片來了!你也能練100億的大模型


#沐神自己表示,覺得3090ti的卡片不是太行。馬上有網友搭腔,「不行就抽了送人吧。」

AI大牛李沐裝機影片來了!你也能練100億的大模型

當然了,這種硬派裝置影片下的評論肯定少不了幽默因素。

AI大牛李沐裝機影片來了!你也能練100億的大模型

只能說,太真實了。

#

以上是AI大牛李沐裝機影片來了!你也能練100億的大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
如何使用LM Studio在本地運行LLM? - 分析Vidhya如何使用LM Studio在本地運行LLM? - 分析VidhyaApr 19, 2025 am 11:38 AM

輕鬆在家運行大型語言模型:LM Studio 使用指南 近年來,軟件和硬件的進步使得在個人電腦上運行大型語言模型 (LLM) 成為可能。 LM Studio 就是一個讓這一過程變得輕鬆便捷的優秀工具。本文將深入探討如何使用 LM Studio 在本地運行 LLM,涵蓋關鍵步驟、潛在挑戰以及在本地擁有 LLM 的優勢。無論您是技術愛好者還是對最新 AI 技術感到好奇,本指南都將提供寶貴的見解和實用技巧。讓我們開始吧! 概述 了解在本地運行 LLM 的基本要求。 在您的電腦上設置 LM Studi

蓋伊·佩里(Guy Peri)通過數據轉換幫助麥考密克的未來蓋伊·佩里(Guy Peri)通過數據轉換幫助麥考密克的未來Apr 19, 2025 am 11:35 AM

蓋伊·佩里(Guy Peri)是麥考密克(McCormick)的首席信息和數字官。儘管他的角色僅七個月,但Peri正在迅速促進公司數字能力的全面轉變。他的職業生涯專注於數據和分析信息

迅速工程中的情感鍊是什麼? - 分析Vidhya迅速工程中的情感鍊是什麼? - 分析VidhyaApr 19, 2025 am 11:33 AM

介紹 人工智能(AI)不僅要理解單詞,而且要理解情感,從而以人的觸感做出反應。 這種複雜的互動對於AI和自然語言處理的快速前進的領域至關重要。 Th

12個最佳數據科學工作流程的AI工具-Analytics Vidhya12個最佳數據科學工作流程的AI工具-Analytics VidhyaApr 19, 2025 am 11:31 AM

介紹 在當今以數據為中心的世界中,利用先進的AI技術對於尋求競爭優勢和提高效率的企業至關重要。 一系列強大的工具使數據科學家,分析師和開發人員都能構建,Depl

AV字節:OpenAI的GPT-4O Mini和其他AI創新AV字節:OpenAI的GPT-4O Mini和其他AI創新Apr 19, 2025 am 11:30 AM

本週的AI景觀爆炸了,來自Openai,Mistral AI,Nvidia,Deepseek和Hugging Face等行業巨頭的開創性發行。 這些新型號有望提高功率,負擔能力和可訪問性,這在TR的進步中推動了

報告發現,困惑的Android應用程序有安全缺陷。報告發現,困惑的Android應用程序有安全缺陷。Apr 19, 2025 am 11:24 AM

但是,該公司的Android應用不僅提供搜索功能,而且還充當AI助手,並充滿了許多安全問題,可以將其用戶暴露於數據盜用,帳戶收購和惡意攻擊中

每個人都擅長使用AI:關於氛圍編碼的想法每個人都擅長使用AI:關於氛圍編碼的想法Apr 19, 2025 am 11:17 AM

您可以查看會議和貿易展覽中正在發生的事情。您可以詢問工程師在做什麼,或諮詢首席執行官。 您看的任何地方,事情都以驚人的速度發生變化。 工程師和非工程師 有什麼區別

火箭發射模擬和分析使用Rocketpy -Analytics Vidhya火箭發射模擬和分析使用Rocketpy -Analytics VidhyaApr 19, 2025 am 11:12 AM

模擬火箭發射的火箭發射:綜合指南 本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。 我們將介紹從定義火箭組件到分析模擬的所有內容

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境