本週觀點
1.1 英偉達:以Omniverse為核心的具身智慧路徑
#英偉達選擇具身智慧路徑,特色是從邊緣向雲端開發,主要產品為VIMA機械手臂和Isaac AMR移動機器人平台。英偉達在ITF2023發布基於VIMA大模型的機器臂,根據英偉達介紹,VIMA能夠理解、推理物理世界並與物理世界互動,例如根據視覺、文本提示移動、排列物體,VIMA還可以運行在Omniverse模擬物理學並做出符合物理定律的預測。 Isaac AMR 是一個用於模擬、驗證、部署、優化和管理自主移動機器人車隊的平台,包含了邊緣到雲端的軟體服務、運算以及一套參考感測器和機器人硬件,透過連接DeepMap 的雲端服務,加速大型環境的測繪和語義理解,在無需資深技術團隊的情況下,將機器人對大型設施的測繪時間從數週縮短到數天,並實現厘米級精度。透過產生豐富的三維體素地圖,它可以為多種類型的自適應網格細化(AMR)創建佔用地圖和語義地圖。
具身智能指的是透過模仿人類大腦的工作方式來訓練演算法,進而實現自我理解、自我優化,並最終以類人的方式進行學習和成長。英偉達VIMA支援文字、視覺、語音等多模態作為機器人的任務輸入,透過包含模擬基準測試、60多萬個專家軌跡、多種等級評估協議等系統化的泛化測試作為目標輸出集合;使用預先訓練後的T5 模型對多模態提示進行編碼,並透過交叉注意力層在提示上對機器人控制器進行調節,預測以提示和交互歷史為條件的電機命令作為預測輸出集合;透過模型預測輸出和目標輸出進行比較和自我優化驅動VIMA自主學習,在最難的零樣本泛化訓練任務中,VIMA的任務成功率比之前的最優方法提高了最多2.9倍,而使用10倍較少訓練數據,VIMA的性能仍然比頂級競爭方法提高了2.7倍。
憑藉真實世界資料集,具身智慧具備核心競爭力,而英偉達Omniverse則是業界標竿。要進行具身智能訓練,需要特殊的資料集。例如,對於VIMA機械手臂,需要以下數據:
1)多模態任務集:17個元任務,每個元任務也可以拆分成1000個單獨任務,包括語意理解、視覺分割等各類多模態任務
2)成功案例:英偉達準備了650K個成功軌跡
3)獎勵基準:建立VIMA-Bench使用機率論的方法合理評估任務AI預測結果,並給予AI正確回饋
英偉達Omnivers是全球領先的數位孿生平台,包含Nucleus、Connect、Kit、Simulation 和RTX 渲染器五個重要組成部分,這些部分以及可互通的第三方數位內容創作(DCC) 工具和渲染器,加上由第三方和NVIDIA 建構的擴充功能、應用和微服務組成了完整的Omniverse 生態系統。透過USD等真實世界資料集,可以做到數位孿生精準符合物理定律、物體運動反應精準且與顯示同步等特性,這些真實世界資料是英偉達具身智能能夠落地的重要基礎。
英偉達邊緣AI自下而上突破的具身智慧路徑已經打通,結合雲端運算可以在邊緣AI從開發到部署的各個環節提供豐富技術支援。 NVIDIA 選擇微軟Azure作為Omniverse Cloud的首家雲端服務商。微軟Azure 將能支援企業在享有Azure 雲端服務的規模分析特性與安全性的同時,存取全套Omniverse軟體應用及NVIDIA OVX™運算系統,為客戶提供了一套可用於設計、開發、部署和管理工業元宇宙應用的全端雲端環境與平台功能,連結並使用NVIDIA合作夥伴生態系的相關產品,如英偉達認證工作站、邊緣運算模組等。
NVIDIA Isaac是專為機器人開發和AI打造的加速平台,AMR移動機器人平台率先落地。英偉達Isaac平台從預訓練模型開始,透過Isaac Replicator 中產生的合成資料進行增強,並使用NVIDIA TAO 進行訓練,從而實現目標性能;利用本地和雲端提供的NVIDIA Isaac Sim創建物理精準的逼真環境,以開發和測試與機器人運行相關的各個方面;利用Nova Ori節省時間,並使用硬體加速SDK 將AI 帶入到基於NVIDIA Jetson的機器人,例如用於基於ROS的機器人的Isaac ROS GEM、用於視訊串流解析的NVIDIA DeepStream SDK、用於自然語言處理的NVIDIA Riva;透過EGX Fleet Command 和Isaac for AMR(包括Metropolis、CuOpt 和DeepMap)管理機器人編隊以優化生產力。 Isaac AMR 是用於模擬、驗證、部署、優化和管理自主移動機器人車隊的平台,包含了邊緣到雲端的數位孿生訓練、軟體服務、運算以及一套參考感測器和機器人硬件,可加快AMR 的開發和部署速度,減少成本和縮短產品上市時間。
Isaac AMR 建立在 NVIDIA Nova Orin 參考架構的基礎。 Nova Orin包括立體相機、魚眼相機、2D 和 3D 雷射雷達在內的多個感測器與系統模組整合在一起,支援先進的AI 和硬體加速演算法,提供 275TOPS 的即時邊緣運算性能。同步和校準的感測器套件為即時三維感知和繪圖提供了感測器的多樣性和冗餘性。雲端原生工具,可用於記錄、上傳和回放,讓偵錯、地圖建立、訓練和分析更加輕鬆。
1.2 高通:雲邊一體的混合AI路徑
高通宣布推出雲端融合混合AI方案,致力於深入開發邊緣AI,同時與微軟等公司合作開發雲端AI。根據高通混合AI白皮書,在混合AI場景中,邊緣大模型是雲端大模型的感知器官,例如用戶對手機說話,自動語音識別(ASR)AI模型如Whisper在設備上轉換語音為文本,發送到雲端,雲端運行大模型,回發文字答案。在進階版本中,設備AI更進一步保護隱私,承擔更多處理,提供更個性化的提示給雲端:透過設備學習和個人數據,設備創建用戶個人形象,與調度程序協作,基於上下文提供更好的提示;例如,用戶要求手機預約和朋友在最愛餐廳吃飯,對簡單查詢,較小的大模型可在設備上運行無需雲交互,如果用戶需要復雜信息,則本地將需求轉化為提示發給雲端大模型並返回詳細答案。
據高通混合AI白皮書,混合AI主要有以下優點:
1)經濟性:降低雲端推理成本、有效率地利用邊緣算力、降低AI應用開發門檻;
2)能耗低:邊緣設備可以以較低能耗運行大模型,若考慮處理和資料傳輸等因素,能耗節約更加顯著;
3)可靠性:邊緣AI不受網路狀況影響,運作更加穩定;
4)隱私性:資料完全在本地推理,大幅降低洩密風險;
5)個人化:邊緣設備可以蒐集使用者真實生活中的行為、價值觀、痛點、需求、關注問題等資訊形成客製化服務。
軟體端:高通AI開發堆疊已經發布。高通AI開發棧支援主流AI框架,如TensorFlow、PyTorch、ONNX和Keras,以及TensorFlow Lite、TensorFlow Lite Micro、ONNX runtime等執行階段。此外,它還包括推理軟體開發工具包(SDK),如備受歡迎的Qualcomm®神經處理SDK(適用於Android、Linux和Windows)。開發人員庫和服務支援最新的程式語言、虛擬平台和編譯器。在較低的層次上,高通AI開發堆疊系統軟體包括基本的即時作業系統(RTOS)、系統介面和驅動程式。高通AI開發棧在不同的產品線上提供豐富多樣的作業系統支持,包括Android、Windows、Linux和QNX,以及Prometheus、Kubernetes和Docker等部署和監控基礎設施高通AI開發棧還包括AI Studio,支援從設計到最佳化、部署和分析的完整大模型工作流程,將所有工具整合到一個圖形使用者介面中,並提供視覺化工具,簡化開發人員的體驗,使他們能夠即時查看模型開發情況,包括AI模型效率工具包(AIMET)、AIMET模型倉庫、模型分析器和神經架構搜尋(NAS)。
硬體端:高通Hexagon Processor核心。高通Hexagon Processor採用全新的架構以及專用的供電系統,在AI推理方面增加了特殊的硬體來改善組卷積、激活函數加速,並將張量加速器的性能提升一倍,採用獨特的方法將復雜的AI模型分解為微塊(Micro Tile)以加速推理過程,標量、向量和張量加速器可以同時工作,無需每次都涉及內存,從而節省功耗和時間。此外也透過實體橋樑實現了與Hexagon的無縫多IP通訊。這種連接可用於推動那些高頻寬、低延遲的應用場景,例如認知ISP或在遊戲場景中提高低解析度。高通Hexagon Processor成功地將多個深度學習模型從FP32轉換為INT4,最高降低60%能耗同時成長90%效能。
高通公司已經在實踐中運用了穩定擴散模型,並且未來其在大型人工智慧邊緣部署方面的規劃已經非常清晰。 2023年2月,高通利用高通AI軟體堆疊(Qualcomm AI Stack)執行全端AI優化,首次在Android智慧型手機部署Stable Diffusion。高通在2023年5月發布了一份混合人工智慧白皮書,其中預測到2023年末,邊緣人工智慧技術將涵蓋各種參數低於10億的模型。
1.3 中科創達:大模型 大平台的軟硬整合發展
#2023年5月18日,中科創達發布Rubik大模型,是國內首個邊緣AI終端統一作業系統的雛形,同時中科創達也與亞馬遜雲端科技共同成立人工智慧聯合創新實驗室,並展示了TurboX模組、智慧音箱參考設計、Rubik GeniusCanvas等一系列創達魔術方塊產品。根據該公司2022年報,公司自成立以來,一直在端側、邊緣側、雲端技術進行沉澱和積累,目前已成為上述領域全球領先的技術廠商。除此之外,該公司的機器人產品已經涵蓋了幾乎所有目前存在的機器人場景,並且得到了全球多家機器人廠商的青睞。並且,公司與產業鏈的技術和產品的頭部企業保持深度的合作,建構了生態的卡位優勢。本公司在邊緣AI的軟體端擁有大模型,硬體端深耕高通、亞馬遜等科技巨頭的生態,軟硬整合的發展路徑極具潛力。
1.3.1 橫向看:中科創達Rubik圍繞現有業務建構AI生態
#Rubik大模型系列核心產品為Rubik Language語言大模型,董事長預計2024年將達到ChatGPT3.5水準。 Rubik Edge、Rubik Multi-Modal以及預計2027年推出的Rubit Robot都將服務智慧型手機和智慧駕駛領域,提升人機互動體驗。同時,Rubik系列圍繞著人機互動和現有業務搭建生態:RubikStudio、RubikAuto、RubikDevice和Rubik Enterprise。在擁有能力強大的大模型同時, 也會把大模型變成各種各樣的中小模型,以滿足各類場景和知識的拆分、提高與客戶的適配性。
與Google類似,中科創達Rubik大模型有望首先落地機器人。在眾多智慧硬體產品中,中科創達的機器人產品可涵蓋各種不同的應用場景,並已協助全球眾多機器人廠商實現了產品的量產落地。基於在機器人領域的深厚積累,中科創達將智能音箱與機器人進行融合,並通過Rubik大模型的不斷訓練, 已經實現了能夠自由對話的智能銷售機器人,可以自主回答客戶關於企業及產品的各種問題。
1.3.2 縱向看:中科創達AI應用生態整裝待發
#中科創達Smart to Intelligent策略開啟,實現從智慧應用為中心到模型驅動的機器與機器、機器與人互動的全新智慧世界。 Rubik大模型將與公司現有的智慧汽車和物聯網業務整合,並透過私有化部署和系統調優來滿足各行業需求。公司預計透過大模型持續優化,將機器人變為現實,並在未來智慧運算產業的toBtoC領域中發揮核心競爭優勢。
RUBIK Auto:汽車實質是一個機器人, 車廠對於汽車大模型主要有以下三類需求,第一是端側運行,端側的體驗、數據、性能是最好的,也是最能保護客戶隱私,但硬體需求較高;第二是私有雲Plugin,可靈活調優;第三類是多種開放模式共存。本公司的RUBIK Auto將支援客戶私有化部署(已與海外頭部車廠合作,基於公司模型做POC研發)、也支援模型量化、剪裁,進而適配各類晶片,靈活與車廠對接。
RUBIK Device:在智慧硬體中,只要涉及大運算的產品,創達的份額領先的智慧硬體原來部署作業系統可以直接加入AI,一旦AI沉澱到邊緣側,意味著智慧硬體變成機器人,就會形成場景的中心。無論是家庭的場景、樓宇的場景、工廠的場景都可以透過邊緣化部署使得等每個場景都成為智慧中心。
RUBIK Enterprise(企業版):中科創達的明顯優勢之一是國際化, 本公司在全球15個國家和地區擁有研發中心和團隊。公司會透過在地化做部署,支援客戶的私有化部署;公司的明顯優勢之二是軟硬體一體,無論是推理或訓練,公司對整個底層的平台都非常了解,因為不管是AI框架,還是說開源的其它框架,本質上是作業系統裡面的一部分,無論是資料並行,還是模型並行,公司認為都是一個個中間件。這些明顯的優勢,能夠讓我們最終把模型性能、效率做到最優,把模型的規模做到最佳,能夠在邊緣側運行起來,為千行百業賦能。
RUBIK Studio:基於公司對作業系統的深刻理解,公司把作業系統的每一段分化、模型化,累積過去幾千個成功發布的Package、幾千億行的程式碼累積、以及長期開發的經驗積累,將安卓知識變成巨大知識庫,發揮巨大的價值,Rubik Studio將會是未來改變整個的一個大的工具和環境。使用者可透過Rubik Studio直接將便利快速地進行PC應用、手機應用、網站相對功能封閉的開發等。
1.4 蘋果:ChatGPT先接入IOS,WWDC 2023值得期待
2023年5月18日,OpenAI發布IOS版ChatGPT APP(同時官宣安卓版APP正在開發中),根據蘋果官網,該應用僅支援英語,年齡分級為“12歲以上”,支援網絡同步聊天記錄、whisper語音輸入等功能。 IOS版ChatGPT下載應用程式是免費的,但會提供APP內售價19.99美元的「ChatGPT Plus」付費專案以開啟性能更強的GPT4大模型使用權限。
重寫後的句子:ChatGPT APP可能成為手機超級APP的原型,並基於此重構人工智慧應用生態系統。根據九派財經,IOS版ChatGPT APP已經擁有靈活解決各類日常問題的能力,ChatGPT APP可以提供即時答案,用戶無需篩選廣告或多個結果即可獲得準確的信息;提供量身定制的建議,用戶可以向其尋求有關烹飪、旅行計劃或製作深思熟慮信息的指導;提供創意靈感,為用戶生成禮物創意、概述演示文稿或寫出優美的詩歌。另外,ChatGPT APP還可以透過專業訊息,如想法回饋、筆記摘要和技術主題等,幫助使用者提高工作效率,並為使用者提供學習機會,幫助其按照自己的步調探索新語言、現代歷史等。我們認為,在ChatGPT Plugin的AI應用生態成功落地的前提下,ChatGPT APP有望成為手機AI應用生態的核心,透過手機用戶海量交互數據的訓練,未來用戶可望透過ChatGPT APP調用其它應用完成各類剛需任務,ChatGPT APP將發展為前所未有的超級APP。
蘋果WWDC 2023的標語為“Code new worlds”,Siri作為重要人機互動入口有望成為蘋果切入AI的重要抓手。根據IT之家、新智元、騰訊雲,蘋果最晚於2023年2月開始開發讓用戶用Siri 為MR製作程式的應用,這項應用程式建構方法背後的技術來自於蘋果在2017年收購的Fabric Software:用戶可以使用Siri來構建AR應用程序,要求AI助理幫助構建允許虛擬動物在房間內移動,在真實物體之上或周圍移動,而無需從零開始設計動物,編程動畫,併計算其在有障礙物的3D空間中的移動的應用程序,這包括「掃描並將真實世界的物件導入頭顯,以便它們可以在3D中準確表示,並如同存在於現實生活中一樣表現」。
1.5 華為:IEF 高斯資料庫全面覆蓋邊緣AI場景
華為智慧邊緣平台IEF是基於雲原生技術構建的邊雲協同作業系統,可運行在大量異質邊緣設備上,並以輕量化的方式將豐富的AI、數據分析、中間件等應用從雲端部署到邊緣,滿足使用者對智慧型應用程式邊雲協同的業務訴求。 IEF具有可以將華為雲AI/大數據的能力延伸到邊緣,支援視訊智慧分析、文字辨識、影像辨識、大數據流處理等能力,就近提供即時智慧邊緣服務;支援容器和函數兩種運作方式,滿足使用者輕量化應用管理的訴求;原生支援kubernetes與docker生態,應用快速啟動、快速升級;支援Python、NodeJS等函數引擎,快速回應邊緣的事件;此外還有相容性優、安全可靠等功能。
華為高斯資料庫是華為基於openGaussDB自研生態推出的企業級分散式關係型資料庫,具備企業級複雜事務混合負載能力,支援分散式事務強一致,同城跨AZ部署,資料0遺失,支援1000擴充能力,PB級海量儲存。同時擁有雲上高可用,高可靠,高安全,彈性伸縮,一鍵部署,快速備份恢復,監控告警等關鍵能力,能為企業提供功能全面,穩定可靠,擴展性強,性能優越的企業級數據庫服務。 2023年6月7日,華為高斯將召開資料庫加速金融核心業務升級發表會。
投資建議:AI從雲到邊的大趨勢確立,我們前期判斷得到持續驗證:邊緣AI是產業趨勢,具身智能是內在邏輯(AI自我提升需要人與環境的交互數據集中在終端) ,機器人是終極應用。我們於2023年5月13日發布報告《中科創達:大模型從雲到邊,終端交互革命孕育歷史機遇》中明確提出谷歌大力進軍終端大模型市場,終端AI成為下一個兵家必爭之地;隨後在5月14日發布《Google的「帝國反擊戰」:AI從雲到邊的拐點》詳細闡述谷歌的從雲到邊的AI藍圖,明確提出AI邊緣部署已經走進現實;透過發布IOS版ChatGPT、Windows AI等AI體驗報告,我們於5月21日發布《ChatGPT APP標誌AI行情新階段》,明確提出大模型作為AI時代的終極操作系統,ChatGPT超級APP只是第一步,生成式AI由雲端向端的邁進仍在加速。本週,英偉達、高通、中科創達等公司都發布相關產品加快邊緣AI落地速度,下週華為、蘋果發布會預計終端AI均是核心看點,AI從雲到邊的大趨勢已經無比明確,建議關注中科創達、科大訊飛、螢石網絡等龍頭企業。
來源:券商研報精選
以上是民生證券:邊緣AI是產業趨勢,這些標的建議關注的詳細內容。更多資訊請關注PHP中文網其他相關文章!