10 月23 日消息,英偉達日前公佈了一個名為Eureka 的AI 系統,該系統以OpenAI 的GPT-4 為基礎,能夠讓機器人執行例如“轉筆”、“開抽屜”、“拿剪刀」、「雙手互傳球」等30 多種複雜動作。
本站經過查詢得知,英偉達研究院主導開發了Eureka,該 AI 系統可令開發者配合英偉達自家物理模擬軟體Isaac Gym 進行強化學習(reference learning)。
英偉達 AI 研究部門資深總監Anima Anandkumar 認為,過去10 年以來“強化式學習”雖然有所進展,但仍存在不少挑戰,例如“獎賞設計”等環節,現在還停留在“試錯”階段。而目前英偉達公佈的 Eureka,則是為執行困難的任務而設計,結合生成式 AI 與強化式學習演算法,進行首次嘗試。
Eureka 利用GPT-4 生成出的「獎賞設計」方案可協助機器人的「試誤(trial-and-error)」學習,並且能夠起到接替80% 人類專家的任務,從而使機器人平均訓練效率提升超過50%。
據悉,在Eureka 產生「獎賞設計」方案時,開發者不需要額外輸入任務提示或撰寫預先定義的獎賞範本,再結合人工修正獎賞,最終使機器人動作更符合開發人員的意圖。
此AI 系統配合Issac Gym 時,可利用GPU 加速進行模擬,並針對大量批次的候選回饋快速評估品質,從而提升訓練效率,並根據訓練結果的作出統計摘要,從而改良“獎賞方案”,在提升機器人反應水平的同時,令AI 系統適用的機器人類型更為廣泛,例如“走獸型”(四足)、“人型(兩足)”、“四軸飛行器」、手臂型等機器人都可以搭載Eureka 系統。
▲ 圖源英威而鋼
▲ 圖源英偉達
英偉達將Eureka 進行了“開源靈敏度標竿測試”,在評估20 種任務訓練結果後,得出了令人滿意的結果。
據此,英偉達認為 Eureka 可實現靈巧的機器人控制,並為動畫作者提供「生成逼真實體動作」的新方法。
以上是英偉達推出 AI 系統 Eureka,可令機器人執行轉筆傳球等複雜工作的詳細內容。更多資訊請關注PHP中文網其他相關文章!