搜尋
首頁科技週邊人工智慧星河AI網絡,大模型紀元的運力答案

星河AI網絡,大模型紀元的運力答案

Sep 30, 2023 pm 07:05 PM
網路星河ai運力答案

隨著AI預訓練大模型的價值不斷顯現,且模型規模愈發龐大。產學各界已經形成了這樣一個共識:AI時代,算力就是生產力。

這認知雖然正確,卻並不全面。數位化系統有存、算、網三大支柱,AI技術也是如此。如果拋開儲存和網路談算力,那麼大模型只能獨木難支。尤其是與大模型適配的網路基礎設施,一直以來都沒有得到有效的重視。

面對動輒「萬卡集訓」「萬裡部署」「萬億參數」的AI大模型,網路運力是整個智慧體系中不容忽視的一環。其面臨的挑戰非常突出,也正在等待可以破局的答案。

星河AI網絡,大模型紀元的運力答案

華為資料通訊產品線總裁王雷

9月20日,華為全聯接大會2023期間舉辦了「星河AI網絡,加速產業智慧化」為主題的數通高峰會。各界代表共同探討了AI網路技術的變革與發展趨勢。會上,華為數據通訊產品線總裁王雷正式發表星河AI網路解決方案。他表示,大模型讓AI更聰明,但訓練一個大模型的成本非常高,同時還要考慮AI人才的成本。因此,在產業智慧化階段,集中建置大算力集群,面向社會提供智算雲服務,才能真正讓人工智慧深入千行萬業。華為發布新一代星河AI網路解決方案,面向智慧時代,打造超高吞吐、長穩可靠、彈性高併發的新型網路基礎設施,協助AI普惠,加速產業智慧化。

藉此機會,我們一起了解大模型崛起,給智算資料中心帶來的網路挑戰,以及華為星河AI網路為何是這些問題的最優解。

當談到AI時代時,一個模型、一條數據、一個計算單元可以被視為一道星光。然而,只有將它們有效率且穩定地連結在一起,才能形成一個輝煌的智慧世界

大型模型的爆發引發了隱藏的網路激流

#我們知道,AI模型分為訓練和推理部署兩個階段。伴隨著預訓練大模型的興起,這兩個階段也分別發生了巨大的AI網路挑戰。

首先是在大模型的訓練階段。伴隨著模型規模與資料參數愈發龐大,大模型訓練開始需要千卡甚至萬卡規模的計算集群來完成。這也意味著大模型訓練必然發生在具備AI算力的資料中心當中。

在目前階段,智算資料中心的成本非常高昂。根據產業數據,每建設100P算力的集群,成本達4億人民幣。以某國際知名大模型為例,其訓練過程中每天的算力花費達到70萬美元

如果資料中心網路的連結能力不順暢,導致大量的運算資源在網路傳輸過程中損失,那麼給資料中心和AI模型帶來的損失是無法估量的。相反,如果在相同的運算能力規模下,叢集訓練的效率更高,那麼資料中心將會獲得龐大的商機。而負載率和其他網路因素直接決定了AI模型的訓練效率。另一方面,由於AI算力集群的規模不斷擴大,其複雜性也相應增加,因此故障發生的機率也在提高。建構一個長期穩定可靠的群集網路是資料中心提高投入產出比的重要支點

星河AI網絡,大模型紀元的運力答案

在資料中心之外,AI模型的推理部署場景中,同樣也可以看到AI網路的價值體現。大模型的推理部署主要依賴雲端服務,而雲端服務商必須在算力資源有限的情況下,盡量服務更大的客戶,以此實現大模型的商業價值最大化。如此一來,用戶越多整個雲端網結構就會越複雜。如何能夠提供長期穩定的網路服務,成為了雲端運算服務商新的挑戰。

除此之外,在AI推理部署的最後一公里,政企用戶面臨網路品質提升的需求。在真實場景下,1%的連結丟包會導致TCP效能下降50倍,也就是100Mbps的寬頻,實際能力不足2Mbps。因此,提升應用場景本身的網路能力,才可以確保AI算力順暢流動,實現真正的普惠AI。

由此不難看出,在AI大模型的誕生、傳輸、應用全流程中,每個環節都面臨網路升級的挑戰與需求。大模型時代的運力難題,亟待破局解題。

智慧時代的網路破局思路可以從星光到星河延伸

大模型的興起帶來了一個多環節、全流程的網路難題。因此,我們必須採取系統性的方法來解決這個挑戰

華為提出了一種面向智算雲端服務的新型網路基礎設施,該設施需要支援「訓練高效能」、「算力不停歇」和「普惠AI服務」這三個能力。這三個能力涵蓋了AI大模型從訓練到推理部署的全場景。華為不僅關注單一需求的滿足和單一技術的升級,而是全面推進AI網路的迭代,為產業帶來了獨特的突破思路

具體而言,AI時代的網路基礎設施需要包含以下能力:

首先,在訓練場景網路需要最大化發揮出AI運算叢集的價值。 透過打造具備超大規模聯接能力的網絡,實現AI大模型的訓練高效能。

其次,為了保障AI任務的穩定可持續,需要打造長穩可靠的網絡能力,保障月級訓練不中斷,同時要有秒級的穩定定界、定位和回复,盡可能降低訓練中斷時常。這就是算力不停歇的能力建構。

再次,AI推理部署過程中,要求網絡具有彈性高並發的特質,可以智能編排海量用戶流,提供最佳的AI落地體驗,同時可以對抗網絡劣化衝擊,保障不同區域間AI算力順暢流動,這也實現了「普惠AI服務」的能力建構。

華為最終推出了星河AI網路解決方案,秉承了這一破局思路。這個解決方案將分散的AI技術整合在一起,透過強大的運算能力,形成了一個星河般的網路

星河AI網絡,給大模型紀元一個運力答案

華為全聯接大會2023的期間,華為分享了以大算力、大存力、大運力加速AI大模型打造的發展願景。新一代華為星河AI網路解決方案,就可以說是面向智慧時代,華為為大模型帶來的運力答案。

對於智慧資料中心來說,華為星河AI網路是以網強算的最優解。

星河AI網絡,大模型紀元的運力答案

其所具備的超高吞吐網路特質,可以針對智算中心的AI集群提供提升網路負載率,強化訓練效率的重要價值。具體來說,星河AI網路智算交換器具有業界最高密400GE和800GE連接埠能力,僅2層交換網路就可以實現1萬8000卡的無收斂集群組網,從而支援超萬億參數的大模型訓練。群組網路層次一旦減少,就意味著資料中心能夠節省了大量的光模組成本,同時提高對網路風險的可預測性,獲得更穩定的大模型訓練能力。

星河AI網路能夠支援網路級負載平衡NSLB,將負載率從50%提升到98%,相當於實現了AI集群的超頻運行,進而提高了訓練效率20%,達到了高效訓練的預期

星河AI網絡,大模型紀元的運力答案

對於雲端服務廠商來說,星河AI網路可以提供穩定可靠的算力保障。

在DCI算間互聯場景中,此技術能夠提供多路徑智慧調度等功能,自動辨識並主動適應業務高峰流量的衝擊。它可以從百萬個資料流中識別大小流,並合理地分配到10萬個路徑,以實現網路的零擁塞,並為高並發的智算雲服務提供彈性保障

對於政企用戶來說,星河AI網路可以應付網路劣化問題,保障普惠化的AI算力。

其能夠在DCA入算場景支援彈性抗劣化能力,採用Fillp技術優化TCP協議,可以在1%丟包率的情況下將頻寬負載率從10%提升至60%,從而保障從都會圈到偏遠地區的算力順暢流動,加速AI服務的普惠應用。

如此一來,大模型從訓練到部署各個環節的網路需求都被打通。從智算中心到千行萬業,都有了以網強算的發展支點。

在一個智慧化的時代,由大模型開啟的科技新紀元剛開始。星河AI網路為智慧時代提供了關於運力的答案

以上是星河AI網絡,大模型紀元的運力答案的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
大多數使用的10個功率BI圖 - 分析Vidhya大多數使用的10個功率BI圖 - 分析VidhyaApr 16, 2025 pm 12:05 PM

用Microsoft Power BI圖來利用數據可視化的功能 在當今數據驅動的世界中,有效地將復雜信息傳達給非技術觀眾至關重要。 數據可視化橋接此差距,轉換原始數據i

AI的專家系統AI的專家系統Apr 16, 2025 pm 12:00 PM

專家系統:深入研究AI的決策能力 想像一下,從醫療診斷到財務計劃,都可以訪問任何事情的專家建議。 這就是人工智能專家系統的力量。 這些系統模仿Pro

三個最好的氛圍編碼器分解了這項代碼中的AI革命三個最好的氛圍編碼器分解了這項代碼中的AI革命Apr 16, 2025 am 11:58 AM

首先,很明顯,這種情況正在迅速發生。各種公司都在談論AI目前撰寫的代碼的比例,並且這些代碼的比例正在迅速地增加。已經有很多工作流離失所

跑道AI的Gen-4:AI蒙太奇如何超越荒謬跑道AI的Gen-4:AI蒙太奇如何超越荒謬Apr 16, 2025 am 11:45 AM

從數字營銷到社交媒體的所有創意領域,電影業都站在技術十字路口。隨著人工智能開始重塑視覺講故事的各個方面並改變娛樂的景觀

如何註冊5天ISRO AI免費課程? - 分析Vidhya如何註冊5天ISRO AI免費課程? - 分析VidhyaApr 16, 2025 am 11:43 AM

ISRO的免費AI/ML在線課程:通向地理空間技術創新的門戶 印度太空研究組織(ISRO)通過其印度遙感研究所(IIR)為學生和專業人士提供了絕佳的機會

AI中的本地搜索算法AI中的本地搜索算法Apr 16, 2025 am 11:40 AM

本地搜索算法:綜合指南 規劃大規模活動需要有效的工作量分佈。 當傳統方法失敗時,本地搜索算法提供了強大的解決方案。 本文探討了爬山和模擬

OpenAI以GPT-4.1的重點轉移,將編碼和成本效率優先考慮OpenAI以GPT-4.1的重點轉移,將編碼和成本效率優先考慮Apr 16, 2025 am 11:37 AM

該版本包括三種不同的型號,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

提示:chatgpt生成假護照提示:chatgpt生成假護照Apr 16, 2025 am 11:35 AM

Chip Giant Nvidia週一表示,它將開始製造AI超級計算機(可以處理大量數據並運行複雜算法的機器),完全是在美國首次在美國境內。這一消息是在特朗普總統SI之後發布的

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。