首頁  >  文章  >  科技週邊  >  迎接人工智慧新機會:青雲AI的無限潛能與不斷進化

迎接人工智慧新機會:青雲AI的無限潛能與不斷進化

王林
王林轉載
2023-09-26 13:13:01767瀏覽

飛象網訊(魏德齡/文)「韓信用兵,多多益善」想必是一個膾炙人口的典故,淮陰侯當時用此來形容自己的領兵才能,當然隨之還有高祖的「善將將」。而「多多益善」與「善將將」的優勢在AI浪潮之下,也正在變成一種產業所必須的能力。

分析師預測,人工智慧市場將迎來長達十年以上的熱潮。在企業資訊科技中,對人工智慧的投入比例將越來越高。人工智慧對需求的刺激將是過去十年的10倍至100倍,相應的運算能力需求也將呈現同等成長。而滿足這需求的保障正是「多」個選擇,因為不同的運算能力需求背後所調用的超級運算中心硬體資源並不相同。正如諺語所說,「多一些選擇,多一些歡笑」。已經實現獲利的國家超級計算中心濟南中心就是一個很好的例子

迎接人工智慧新機會:青雲AI的無限潛能與不斷進化

更多選擇,更多歡笑

以目前常見的幾類AI用例需求而言,許多大學進行的傳統科學計算類應用就需要HPC,才能完成如仿真、模擬、洋流預測、基因檢測等工作;對於傳統的政務雲業務、傳統CRM/ERP企業數位化應用則屬於傳統雲端運算需求,就需要呼叫CPU類資源;目前大熱的涉及道路辨識、車牌辨識這樣的智慧城市類應用則需要呼叫GPU的能力。業務的多元需求恰恰決定了多元算力的需求。

據報道,僅僅三年前,濟南的國家超級運算中心就已經擁有1000P的運算能力和超過300PB的儲存容量,成為當時亞洲最大的運算中心之一。該中心包括了高效能運算、以CPU為主的傳統雲端運算以及以GPU為主的智慧運算。在智慧運算領域,該中心兼顧了國內需求,並引入了一部分國產GPU,使其成為一個既具備多元運算能力又具備異質運算能力的超級運算中心

「投資建造一個平台後產生的效益取決於平台能力,因為平台能力越強,能支撐客戶的業務種類就越多。客戶越多,獲利模式越清晰。」三年前參與服務國超算濟南中心的青雲科技總裁林源向媒體解釋了緣何需要異質運算與多元算力。

反之,如果不 embrace 多元算力,僅僅建造一個只支援某一種硬體算力為核心的超算中心,往往會在後續實際運作中面臨尷尬。例如,國內某大廠曾在某地建了一個運算中心,但由於只支援某一個 GPU,造成當應用需求到來時,卻出現了不相容的問題,導致客戶面變窄的問題

不過,如何調度如1000P的算力與300PB存儲,將多元與異構整合在一起,讓超算中心實現高效運營,如同韓信用兵一般,實現多多益善,而不是陷入管理困局,同樣是一個需要面對的問題。青雲科技作為國家超算濟南中心建設的參與者,恰恰為其提供了統領全局的能力,這就需要提到該公司近日發布的新產品—AI算力調度平台。

青雲AI,多多益善

我們已經在國家超算濟南中心的實踐中取得了成功,這證明了青雲平台的能力和成就。林源對這個產品非常有信心。青雲AI算力調度平台是運算中心營運商的重要工具,可以建立從建設到營運的閉環。在國家超算濟南中心的案例中,我們不僅在三年前就成功地進行了實踐,還幫助中心實現了良好的運營和盈利

迎接人工智慧新機會:青雲AI的無限潛能與不斷進化

青雲AI算力調度平台具備了像「韓信用兵,多多益善」一樣的管理能力,可以統一管理GPU算力、HPC算力、多儲存系統、模型資源和資料資源等多種資源,實現算力平台的自動化管理。此外,該平台還能根據不同產業的需求進行資源分發,並具備分散式調度與管理能力,自動分配與管理算力資源,大幅縮短任務執行時間,提高工作效率,讓客戶專注於業務創新與應用開發

平台的管理作業也易如反掌,透過統一營運和維運管理平台,實現多種服務場景的營運化服務的後時,規範化高效運維,幫助用戶實現精細化運作。青雲會為平台管理員交付一個視覺化的大螢幕管理介面,可輕鬆瀏覽全國的數千台算力資源與儲存。以國家超算濟南中心為例,後端其實只需要10-20人的團隊,就能實現對於軟體的運維,並解決客戶的各類問題。

青雲科技透過使用一套營運維運平台,使得定價、折扣、促銷等作業只需在頁面上點擊按鈕即可完成。青雲科技的產品經理苗慧表示,與傳統的雲端運算申請表等日常流程相比,青雲的AI算力調度平台在運維效率方面具有明顯的優勢

同時,青雲AI算力調度平台還可協助客戶解決網路交換速度、環境建置、多業務整合等問題。

除了大幅提昇平台維運人員的管理能力外,對於平台使用者而言,青雲也能進一步提升AI落地的開發效率。面向演算法工程師,青雲提供的開發主機,已經內建了一些開發環境和IDE環境,工程師可將Python工程文件等直接傳上去,在線寫程式碼、調試、運行,立即找到所需的訓練集群。推理完成後,還能實現演算法調優,透過算力集群與模型不斷優化程式碼。

此外,青雲還提供了線上培訓平台,將高效能運算和GPU卡等整合。在專屬環境中,青雲提供了一個GPU伺服器在線上申請建置叢集的選項,所有的網路和環境都可以一鍵產生。同時,青雲也會根據業界常用的模型和小工具進行整合

容器推理平台支援一鍵部署高效能的Kubernetes叢集。在推理過程中,如果遇到效能瓶頸,可以實現負載平衡和彈性伸縮

青雲也提供了模型倉庫,方便客戶可以透過模型市場立即部署自己的模型,呼叫自身的服務。同時,也能給予模型進行微調,或在線上透過雲端平台的形式一鍵取得。

總的來說,青雲AI算力調度平台以類似於管理本地資源的方式來管理AI基礎設施,提供多元化的算力調度和智能化的算力調度,確保算力能夠快速投入使用

開放生態,讓客戶「善將將」

#作為一家具備「多多益善」能力的青雲AI算力調度平台,我們面臨的第二個問題是,是否有機會讓使用者也具備「善將將」的實力。實際上,在未來的AI時代,由於投資龐大,單一企業可能很難實現全面覆蓋,因為每個方面的成本都將比過去十年更高。舉個例子,一個大型模型可能需要耗費大量的人力、算力、金錢和時間成本,而CPU和IDC建設等方面也是如此。因此,青雲正在與不同領域的合作夥伴一起實現能力的整合

我們有一個大膽的設想,AI領域將會出現一個巨頭。然而,我們認為這個巨頭不應該是一家獨立的公司,而應該是一個小型生態系統。林源隆引出了青雲AI算力雲服務的定位,即透過開放生態同盟的方式共同運作

迎接人工智慧新機會:青雲AI的無限潛能與不斷進化

這項設想主要基於三方面的考慮,首先是生態將能夠滿足客戶需要完整解決方案的需求,其次每位專業參與者間都有著彼此的需求,並彼此保持開發,最終志同道合形成長期共贏的同盟。

從客戶需求來看,客戶需求的完整解決方案包括機房、算力、調度平台、模型、模型驅動、Model Service,以及可以運作的應用。其中從算力、模型、服務到應用場景每一層都需要極強的專業。

青雲AI算力生態體系目前已經圍繞AI算力基礎設施的生態共享、AI算力大模型的資源整合以及AI數據資源的生態整合實現了構建,進而更好地幫助企業實現真正的業務價值。林源在媒體訪談過程中將其分類為技術生態與商業生態,其中技術生態包括GPU與模型生態,商業生態則包括計算中心的投資建設、AI最終客戶等

目前青雲已經實現了從適配、MaaS、共築到最終落地的生態體系整合,涵蓋了從各大知名晶片廠商、模型開發商、雲端資料中心供應商等多層面的聯手。對於青雲AI算力雲的客戶而言,正如同是可以調動大量名將的AI開拓者,達到「善將將」的效果。

林源表示,在每個新時代到來之際,人們都站在同一起跑線上,而新時代可能需要一些新的合作模式和玩法。他認為,人工智慧時代的到來可能會帶來新的格局變化

「多多益善」之後的成功故事自不必表,如今AI正被視作是雲服務之後的又一新機遇,「能做、做過,做成功了」的青雲AI恰巧也已經展現出了「多多益善」的自信,後續的精彩篇章正在開啟。

以上是迎接人工智慧新機會:青雲AI的無限潛能與不斷進化的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:sohu.com。如有侵權,請聯絡admin@php.cn刪除