搜尋
首頁科技週邊人工智慧AI大模型時代,資料儲存新基座助推教科學研究數智化躍遷

生成式AI(AIGC)開啟了人工智慧通用化的新紀元,圍繞大模型的百舸爭流蔚為壯觀,算力基礎設施是首要的競逐焦點,而存力覺醒也日益成為業界共識。

AI大模型時代,資料儲存新基座助推教科學研究數智化躍遷

在新的時代,大模型從單模態走向多模態,參數和訓練資料集的規模呈幾何級數增長,海量的非結構化資料需要高性能混合負載能力的支撐;同時,資料密集型範式大行其道,超算、高效能運算(HPC)等應用場景邁向縱深,既有的資料儲存基座已難以滿足不斷升級的需求。

如果說算力、演算法、數據是驅動人工智慧發展的“三駕馬車”,那麼在外部環境發生巨大變化的背景下,三者亟需重新達成動態的平衡。演算法模型完善帶來的「軟實力」提升,算力供給優化引發的「硬實力」增強,需要進一步的加持-資料傳輸的「運力」和資料儲存的「存力」即是尚待改進的動力來源,新型的資料儲存基座將在應對諸多挑戰的過程中破繭成蝶。

需求複雜且持續進化的應用場景,是資料儲存新基座最好的試金石。從這個意義上講,教科研產業就是其中的典型代表:算力與資料是該領域數位轉型的關鍵要素,學科融合的科學研究運算與基於資料的決策支援同等重要。從HPC邁向HPDA(高效能資料分析)是改善教學及科研效率的一大步,而AI的賦能則有助於解決過往算不了、算不準、算不動的難題。

AI大模型時代,資料儲存新基座助推教科學研究數智化躍遷

在近日舉辦的2023世界人工智慧大會上,華為OceanStor Pacific分散式儲存輔助上海交通大學建構的HPC AI存力底座正式上線,「交我算」統一資料基座將在今年再擴充25PB,其可望成為教科研數位化、智慧轉型的新標桿,也為資料儲存新基座的探索之旅樹立了里程碑。

數據與算力的關係演變與衍生挑戰

伴隨千行百業的數位轉型進入深水區,以及人工智慧、大數據等新興技術的協同爆發,數據與算力的關係正在發生微妙的變化。

AI大模型時代,資料儲存新基座助推教科學研究數智化躍遷

教科研領域身處數位經濟的風口浪尖,對此變化頗為敏感。過去,數據必須跟著算力跑。為了應對複雜科學和工程問題的快速數值求解,教科研界在很長一段時間裡更專注於如何打造最強大的算力,而數據僅作為算力的配套設施來考慮。

如今,「算力圍著資料轉」逐漸成為新的趨勢。新興應用的湧現、資料量體的膨脹、資料安全問題的凸顯,讓資料本身的價值備受重視。基於AI、大數據等技術的突破,傳統超算正向資料密集型超算演變,多元異質算力需要圍繞同一個資料儲存基座進行建構。

上海交通大學網路資訊中心副主任林新華認為,數據與算力的主導權發生逆轉,既是建設數據密集型超算平台的契機,也為統一數據存儲基座的構建帶來不少新的挑戰。

首先是資料爆發式成長,對儲存容量的需求顯著提高。根據統計,「交我算」平台的資料規模成長幅度達到每年7PB,氣像海洋、能源探勘、衛星遙感、基因定序、冷凍電鏡、AI自動駕駛、製造CAE、動畫渲染等應用情境的資料量都達到PB級,用一套資料基礎設施容納如此龐大的資料量殊為不易。

其次是新業務不斷湧現,對儲存效能要求更高。 AI通用化進程的提速,特別是大模型、多模態的批量輸出,對IO性能構成嚴峻挑戰。在百TB級資料集成為常態的情況下,自然語言處理、多模態應用加劇了資料量的增速,小檔案訓練資料集的高效存取更要求儲存效能再上新台階。

再次,跨校區多叢集儲存共用,資料在異質叢集間的流動可能造成資料遺失、運作緩慢等問題。 「交我算」平台提供多種異質算力,擁有ARM叢集、X86叢集以及AI叢集等。在眾多集群中,只有做到全數據流動和數據融合,才能釋放算力和數據的最大價值。

最後,傳統AI本地盤訓練,伴隨高並發資料分析,打破IO牆迫在眉睫。資料多次搬遷過程中的IO瓶頸非常突出-傳統的讀寫流程冗長,載入資料涉及三次資料搬遷,checkpoint也有兩次資料搬遷,其間產生的效率損失不容忽視。

分散式儲存統一融合資料基座的突圍路徑

為了因應上述挑戰,自2019年起,上海交通大學與華為儲存展開深度合作,共同打造「交我算」資料密集型超算平台。依託在技術與應用創新上的深厚積累,華為OceanStor Pacific分散式儲存產品協助「交我算」建構統一資料基座,支撐起全校多種異質算力平台。

AI大模型時代,資料儲存新基座助推教科學研究數智化躍遷

建構分散式統一融合資料基座,是「交我算」擁抱新興資料應用的必經之路。基於橫向擴展分散式儲存架構,「交我算」平台的儲存容量和頻寬可按需擴充。一是性能容量線性成長,單集群可達EB級容量;二是藉助高密大容量硬件,節省機櫃空間;三是採用大比例EC,以場景化壓縮提升磁碟利用率。

據了解,「交我算」平台從初始的2PB容量、6GB/s頻寬,到2020年增至20PB容量、60GB/s頻寬,2022年又擴容至40PB容量、120GB/s頻寬,預計2023年容量將再擴充25PB。同時,華為OceanStor Pacific分散式儲存擁有5U 120碟位的超高密設計,結合超大比例EC資料冗餘保護演算法,在滿足高可靠性的基礎上將硬碟空間利用率提升至91.6%。

分散式全閃硬體加持是「交我算」應對儲存效能難題的基石。在華為OceanStor Pacific的助力下,「交我算」平台採用全閃硬體加速,大幅提升頻寬與IOPS效能,每節點80萬IOPS、頻寬20GB/S能夠滿足混合負載條件下的高效能需求。

全域分散式儲存跨校區統一管理是「交我算」解決多叢集儲存共用難題的良方。透過採用全域檔案系統跨域多套儲存管理的方式,「交我算」平台建構起跨校區的統一資料基座,在華為OceanStor Pacific分散式儲存產品的支撐下,達成全域檔案視圖、資料管理與調度、全域資料流動、統一串流元資料等多重目標。

資料分析加速、多種協定存取無損互通、免搬遷高效用是「交我算」打破IO牆的利器。基於華為面向AI的儲存方案,以及華為OceanStor Pacific分散式儲存「一份數據,多種協議存取」的能力,「交我算」平台實現外部儲存減少數據搬遷,並大幅提升分析效率、節省存儲空間。

大模型時代HPDA AI的未來圖像

透過「交我算」平台攜手華為儲存打造分散式統一融合資料新基座的演進軌跡,不難看出資料密集場景正在加速進化。

從早期的HPC到後來的HPDA,再到HPDA AI的比翼齊飛,教科研產業的應用場景不斷豐富,對儲存產品和資料基座的需求也持續躍遷。事實上,教科研只是千行百業數位化進程的冰山一角,資料儲存的大時代已呼嘯而來。

大模型時代的到來,將進一步重塑包括存力在內的IT基礎設施,帶有嶄新AI基因的儲存產品有望成為產業數位化升級的新寵。 7月14日,主題為「資料新典範 釋放AI新動能」的大模型時代華為AI儲存新品發表會將在線上舉行。無論您正在企業內部署AI,或是讓開發的應用具備AI能力,此次發表的方案都將提供更優的技術架構與產品,幫助您踏準時代的節拍。

人工智慧通用化的大幕已經開啟,儲存產業的領頭羊率先吹響了衝鋒的號角,後面的每一個樂章都值得期待。

以上是AI大模型時代,資料儲存新基座助推教科學研究數智化躍遷的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
烹飪創新:人工智能如何改變食品服務烹飪創新:人工智能如何改變食品服務Apr 12, 2025 pm 12:09 PM

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

Python名稱空間和可變範圍的綜合指南Python名稱空間和可變範圍的綜合指南Apr 12, 2025 pm 12:00 PM

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

視覺語言模型(VLMS)的綜合指南視覺語言模型(VLMS)的綜合指南Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容Apr 12, 2025 am 11:52 AM

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

生成的AI遇到心理摩托車生成的AI遇到心理摩托車Apr 12, 2025 am 11:50 AM

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

原型:科學家將紙變成塑料原型:科學家將紙變成塑料Apr 12, 2025 am 11:49 AM

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

AI分析師的崛起:為什麼這可能是AI革命中最重要的工作AI分析師的崛起:為什麼這可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版