已經霸榜兩年,完成四連霸的日本富嶽終於跌落了「神壇」。
在剛公佈的2022年全球超算Top500名單中,美國橡樹嶺國家實驗室(ORNL)的Frontier奪得第一。 憑藉著1.102 Exaflop/s的HPL分數,Frontier不僅是有史以來最強大的超級計算機,它也是第一台真正的「E級超算」。
相較之下,中國的神威·太湖之光和天河二號排名下滑至第六和第九。 去年,美國將神威·太湖之光的處理器供應商申威列入了實體清單,或多或少給中國超算的發展造成了影響。
這次Top500的64位元浮點計算總算力為4.4 exaflops,比六個月前的上一期榜單增加了44.7%。
那麼,Frontier的表現到底達到了怎樣「逆天」的程度呢? ! 簡單來說,就是把排在它之後的468個超算的算力加起來,都比不過一個Frontier。
除瞭如此炫目的算力之外,Frontier還是全球跑AI最快的超級電腦之一。在HPL-AI基準的混合精度效能測試中,Frontier跑出了6.88 ExaFlops的成績。
用白話來說,這個表現相當於,給一個860億神經元組成的智能體中的每個神經元,每秒鐘都下達6,800萬個指令。 用這個訓練AI大機型,那可真是火箭引擎搭上了一級方程式賽車,可以直接在賽道上起飛。 全新的Frontier佔地372平方米,由74個HPE Cray EX機櫃組成,可容納9,408個節點。
其中,每個節點有一個AMD Milan 「Trento」 7A53 Epyc CPU,搭配512GB DDR4記憶體和4個AMD Radeon Instinct MI250X GPU。 總的來說,該系統有602,112個CPU核心,與4.6PB的DDR4記憶體連接。 此外,37,888個AMD MI250X GPU具有8,138,240個核心,並搭配了4.6PB的HBM內存(每個GPU有128GB)。 CPU和GPU使用基於乙太網路的HPE Cray Slingshot-11網路結構進行連接。
儲存上則與一個效能極佳的儲存子系統相連,有著700PB的容量,75TB/s的吞吐量和150億IOPS的效能。 元資料層分佈在480個NVMe SSD上,提供10PB的整體容量,而5400個NVMe SSD為主要的高速儲存層提供11.5PB的容量。 同時,47,700個PMR硬碟提供679PB的容量。
散熱方面,基於水冷的系統讓6000加侖的水在350馬力的泵在整個系統中「移動」,由此將溫度控制在了85度左右。 直觀來說,這些水泵可以在30分鐘內填滿一個奧林匹克標準游泳池。 Frontier不僅是現在全世界最快的超算,也是最環保的超算。
Frontier的能耗比,亦居全球超算的環保程度Green500榜單之頭。單一由第三代AMD的Epyc處理器與Instinct MI250x加速器組成的機櫃單元,其能耗效率為每瓦電能運算62.68 gigaflops。
不過,要將Frontier組裝起來可不容易,ORNL必須採購685個不同編號的6000萬個零件。 此外,在建造過程中還得應付晶片的短缺。
ORNL受影響的零件編號有167個,算下來是200萬個零件。而AMD缺少MI200 GPU的15個編號的零件。
于是ORNL与ASCR合作,为这些零件获得了国防优先权和分配系统(DPAS)评级,这意味着美国政府可以使用年度的防务预算,用显著高于市场价的更优厚价格来采购这些部件。 很快,「短缺」的问题也就得到了解决。
经过这波操作,是不是可以解开很多人心中所谓的「疑惑」了呢? 美国:为了我们的国防事业,加大力度搞超算!
虽然这么花钱,但用处不可谓不广。在英伟达老黄这种财主老爷都要做地球数字孪生体的时代,各国官方部门的超级计算机在开发处理庞大数据的AI、模拟气候和产业用途等方面越来越重要。 就算橡树林自己用不完这算力,也可以租、售嘛,工业界对算力可是嗷嗷待哺。
而且这已有他国先例:在预测机床材料加工结果的实验中,日本DMG森精机床自带工业电脑需要8小时,但富岳只需要10分钟就完成了。
在新一期榜单上,中国和美国仍然是上榜最多的国家。
在上榜超算数量上,中国仍为173台,和上期持平,继续位列榜首。美国从上期的150台下降到127台,排名次席。尽管如此,这两个国家仍然占了TOP 500榜单总数的60%。 日本、德国、法国分别以34、31、22台位列3-5位。
虽然此次Frontier正式成为世界上最强大的超级计算机,但它还没有与去年被曝光的两个中国超算进行比较。 不过,这两个系统目前都没有向Top500提交测试数据。
根据爆料的数据,有不少外媒推断Sunway OceanLight(神威·海洋之光)超级计算机在HPL基准上的峰值约为1.3 exaflops/1.05 exaflops,而天河三号则能够达到1.7 exaflops峰值/1.3 exaflops持续值。然而,考虑到美国在芯片上的各种「卡脖子」,中国超算刷榜的后果很有可能就变成了一个制裁的「靶子」,想必短时间内应该不会看到任何有关数据的更新了。
上榜数量占比上,中国以34.6%的比例占据榜首,美国以25.4%的比例位列第二,中美争霸的态势依旧。
而在总性能排行榜上,美国的优势仍然不可动摇,以47.3%的总算力牢牢占据首位,不难看出,此次登顶的Frontier为美国稳定霸榜贡献不小。
此外,此次Top 500榜单还统计了自1990年起超算算力的进步趋势,并进行了线性回归。 表中横轴为时间,纵轴为算力(取对数)。
绿色点为上榜超算的总算力,黄色三角为榜单冠军的算力,蓝色方块为榜单倒数第一(第500名)超算的算力。对应颜色的直线为线性回归的结果。 可以看到,这三条直线大致符合摩尔定律的对算力提升的预测性判断。 都说摩尔定律已死,看起来在超算领域,它还活的很好很健壮。
美国并不是唯一取得显著成绩的地区。欧洲也表现良好,从总排名上看,美、中、日占据前3,前十中剩余的七席则全部为欧洲国家占据。
其中德国上榜31台,法国上榜22台,意大利上榜14台。 芬兰新部署的LUMI超级计算机以151.9 petaflops的FP64性能勉强超过美国的Summit,获得第3名。
另外,法國GENCI-CINES的Adastra以46.1 petaflops的性能險些奪得第10名。雖然遠不及LUMI強大,但Adastra仍然保持著歐洲第二強大的超級電腦的殊榮。 LUMI和Adastra等系統也說明了另一個趨勢。與Frontier一樣,它們基於HPE的全AMD Cray EX平台,使用第三代Epyc CPU和Instinct GPU。
長久以來,AMD第一次在Top500中的系統內的主機CPU中佔有代表性的份額,但英特爾至強處理器仍占主導地位。
從本世紀初開始,英特爾在高效能運算領域開始發力,只花了幾年時間,就將IBM、惠普等幾家之前的主要玩家排擠得元氣大傷。 從2017年到2020年,英特爾在高效能運算領域達到極盛的市場佔有率一度超過90%。
直到目前,英特爾的市佔率仍高達77.4%,下降了4.2個百分點,而AMD的市佔則剛好上升了這個數字。預計Epycs會在與Xeon SP的競爭中獲得更大的動力。而且,AMD有後來居上的勢頭。在2022年的全球超算Top500名單中,現在有94台超算依賴AMD的產品,年度成長95%。而AMD的 Instinct MI200 加速器首次被其中7台超算採用。
另一個問題是,為什麼不用GPU加速器?可能是因為貴? GPU加速器作為運算引擎,可以提升龐大的效能和性價比,但目前,加速器並沒有在Top500榜單上的超算架構中佔據主導地
#位。這些GPU加速器主要是英偉達的。 但是,除了英偉達自家的HPC中心有大量應用需要移植到GPU上,而且不差錢之外,世界上成千上萬的其他HPC中心還是差錢的,這些HPC的程式碼是明確為CPU編寫的。
目前的Top500名單中,只有170台超算採用了GPU加速器--當然大部分來自英偉達。 另一個因素是,較便宜的CPU本身現在也在陸續增加類似GPU的加速運算功能,例如向量和現在的矩陣運算等。
這樣就比將CPU程式轉移至GPU運作更省錢,也更容易程式設計。我們可能永遠看不到一個主要由GPU加速系統組成的Top500名單了。 事實上,在「富嶽」、「太湖之光」這樣排名前幾名的超算系統中,CPU基本上扮演了具備向量和矩陣計算型GPU的作用。
以上是美國重奪全球超算第一名!人類實現百億億次E級超算,Frontier屠榜全球Top500的詳細內容。更多資訊請關注PHP中文網其他相關文章!