首頁 >科技週邊 >人工智慧 >雲端運算通用可程式DPU發展

雲端運算通用可程式DPU發展

WBOY
WBOY轉載
2023-04-07 19:31:05948瀏覽

著重於資料中心的技術發展和演進,DPU 作為通用的資料處理器,它不是對NIC/SmartNIC 的簡單替代,而是對網路基礎架構的本質改變。 DPU 本身所具有的通用層級化可編程性、低時延網路、統一管控的特性使得 DPU 正在促進新一代資料中心從架構上實現最佳化和重構。 DPU 作為通用資料處理的基礎元件,將卸載原本運行在CPU、GPU中的通用資料處理任務,釋放CPU、GPU 的算力,支撐 CPU、GPU 發揮更大的效能。

雲端運算通用可程式DPU發展

雲端運算通用可程式DPU發展白皮書(2023年)」白皮書透過闡明並分析DPU 發展的過程與現狀,指出哪些DPU 特性是解決上述核心問題的關鍵點,進而推動DPU 技術的深入發展,協助實現完整的生態鏈建設與產業落地。

關於DPU技術應用與技術原理,#請參考文章「DPU技術原理、算力效率及應用場景解析」與「主流DPU架構實作及技術比較」、「## DPU效能基準:評估架構與測試流程介紹(2022)」以及「##DPU全球格局,國內5家崛起(2023)」。

重點分析了DPU需具備的一般可程式特性和各種應用場景,同時分析了傳統DPU的限制。

近年來,由於業界沒有優異且成熟的商用DPU SoC (System on a chip)方案,各大雲廠商只能各自研發基於CPU FPGA的DPU方案,導致DPU被誤解為是個碎片化的市場,DPU對雲端運算的作用及潛力沒有被業界正確認識。 在「十四五」規劃明確指出加速新基礎建設建設後,東數西算工程和營運商算力網路建置如約而至。數位經濟的背後,雲端運算是最核心的算力底座。在雲端運算裡面,DPU已成為基礎設施最核心的元件之一。

數位經濟時代,雲端運算不斷進入各行各業。中國移動作為雲端運算“國家隊”,正在加大投入,全力支持政府與國有企業數位轉型,降本增效,並為國有資料安全保駕護航。在該白皮書中,雲豹智慧作為中國移動唯一邀約參編企業,是國內DPU晶片頭部企業,也是國內已知真正能做到高性能通用可編程DPU SoC的晶片公司。該白皮書的聯合發布,代表中國行動和雲豹智慧在DPU領域的深度合作,強強聯手,為國家雲端基礎架構及DPU的發展貢獻力量。

以DPU為中心的資料中心網路架構

傳統資料中心隨著網路頻寬逐步從25Gbps向100Gbps、200Gbps、400Gbps甚至更高的頻寬演進,網路資料處理佔用的CPU算力資源也不斷地增大,甚至會有一半以上會消耗在這些基礎設施的功能上,因此迫切需要一種新型處理器來減少對雲端主機CPU的消耗。 DPU是以資料處理為中心,提供資料中心基礎設施服務的通用處理器,是繼CPU、GPU之後的“第三顆主力晶片”,可以卸載及加速網路和存儲,同時具備安全和管控等基礎功能,釋放更多的算力資源供顧客使用。在雲端運算與資料中心場景下,如果需要進一步提升算力與發揮基礎架構效能,譬如動態、彈性地調度算力、網路與儲存資源,那麼DPU是必須的,且是不可取代的。

目前,國內雲廠商大部分還是基於CPU FPGA的DPU解決方案,這些方案在研發投入上擁有一定的時間優勢,但因其功耗過高及性能受到限制,並未達到新一代雲端運算的要求。另外,由於FPGA基本上被國外兩大晶片巨頭壟斷,其高昂的價格也直接導致了產品成本居高不下,影響市場競爭力。

DPU SoC的產品是前者迭代的終極形態,需具備超高的異構晶片技術,通用可編程等特性,連同先進的晶片工藝,才能夠滿足更複雜、更廣泛、更高性能的應用需求。目前,國外晶片巨頭和頭部雲端服務商都選擇了通用DPU SoC的產品路線,因為相對於CPU FPGA的方案,DPU SoC 有4到8倍性價比的提升。

各雲端廠商都在尋找最佳方案來提升各自的利潤和競爭力,因為了解到CPU FPGA並不是一個長遠能滿足新一代雲端運算的方案,所以都在期待一款有競爭力、易用及高性價比的DPU SoC出現。

美國的亞馬遜雲端(AWS)不僅佔據全球雲端運算市場最高份額,而且多年前已最先實現了DPU SoC(AWS稱之為Nitro)商業化的成功部署。 AWS在使用自研的DPU SoC後,每年販售每台伺服器的算力資源可以多獲得數千美元的收益。 AWS擁有數百萬台伺服器的量,因此DPU帶來AWS的收益是龐大的。 DPU在AWS的成功應用,受到業界廣泛關注,並吸引了越來越多的晶片巨頭湧入DPU賽道。 Nvidia於2020年以69億美元成功收購了業界知名網路晶片和設備公司Mellanox,透過融合Mellanox的網路技術,快速向全球資料中心市場推出BlueField系列的DPU SoC。 AMD於2022年以19億美元收購了DPU SoC廠商Pensando。而國內的雲端廠商也正在尋求從FPGA架構到通用可程式DPU SoC演進的技術方案。

正是在這樣的背景下,中國行動聯合信通院和雲豹智慧發布了《雲端運算通用可程式DPU發展白皮書(2023年)》。深度解析了DPU的發展趨勢:通用可程式化、低時延網路、統一資源管理。同時介紹了通用可程式DPU SoC在資料中心、營運商、異質運算等多種不同的應用場景。

國內的資料中心建置中,伺服器正在從25G向100G及更高頻寬發展,並且應用部署的複雜度持續增高,不僅要支援虛擬機器、容器的應用管理部署,也需要支援裸金屬應用。 DPU作為資料中心的核心基礎設施部件,要具備靈活的程式設計能力、資料的高吞吐能力和統一管控的能力,才能滿足當前各種雲端運算業務和資料中心發展的需求。

根據半導體產業觀察的了解,目前雲豹智慧是國內已知真正能做到自研高性能DPU SoC的晶片公司,其產品也將是國內第一款通用可程式DPU SoC晶片。不僅提供高達400G的數據吞吐能力,還搭載性能強勁的CPU處理單元並配合多種可編程的數據處理引擎實現層級化可編程能力。根據此白皮書的描述,雲豹智慧在DPU的多個關鍵領域掌握並引領著多項核心技術:

  • ##可程式高效能網路處理技術
  • 可程式低時延RDMA技術
  • DDP(Data Direct Path)資料直通技術
  • 安全運算體系
雲豹智慧型DPU SoC支援裸金屬、虛擬機和容器統一運維和管控,提供彈性網路和儲存、虛擬化管理和安全性等一站式解決方案,大幅提升雲服務商的服務品質與業務彈性,降低整體投入,引領資料中心向算網融合持續演進。

中國移動作為支援國家數位經濟的主要雲端服務商,在這白皮書給出了明確的答案,DPU SoC是雲端運算的關鍵部件,通用可編程的DPU SoC可以實現對資料中心的算力、網路和儲存資源的經濟高效卸載和管理。也明確分析了DPU SoC需具備的關鍵特性:層級化可程式性、低時延網絡,統一管控以及適應持續發展的加速卸載,是雲廠商推動資料中心向高效率、高擴展、高頻寬、高靈活性發展的重要技術支援。同時,也是各雲廠商正在積極研究及探尋的DPU技術的發展方向。

以上是雲端運算通用可程式DPU發展的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除