AI究竟還能完成什麼出乎人類意料的工作?最近,Nvidia公司的人工智慧研究員把語言模型GPT-4引入了沙盒遊戲《我的世界》中,試圖從中發掘出AI更複雜的能力。
5月25日,英偉達團隊與加州理工學院等諸多高校在內的研究者們發布了Voyager,按照他們在論文中下的定義,Voyager是一個具有大型語言模型的開放式具象化智能體,被接入自由度較高的電子遊戲《我的世界》。
AI在遊戲中實現的各種操作
Voyager被賦予的任務是完成遊戲中存在的各種目標,包括了生存、戰鬥以及建造,並且隨著遊戲時間和經驗的積累逐步提高自己的技能。
而當系統產生了這個目標後,GPT-4就會自動產生實現目標所需的程式碼,以此讓角色完成對應的動作。
這個專案最創新的部分在於是用GPT-4來產生驅使遊戲人物行動的程式碼,而AI的實現邏輯和人類一樣,第一次嘗試某個任務時難免會失敗,但它會收集錯誤資訊和遊戲回饋,根據狀況調整程式碼並最終完成任務。
隨著遊戲時間變長,Voyager建立了一個自己的程式碼庫,以便更快速地建造遊戲裡種類繁多的道具,這種行為也可以理解為AI正在累計自己的遊戲經驗。研究人員將Voyager的遊戲進度與其他人工智慧代理做對比,結果發現Voyager獲得的物品數量是其他AI的三倍,探索的距離、建造物品的速度也遠勝於其他對照組。
相同時間下,Voyager是最早做出鑽石劍的
之所以選擇《我的世界》作為測試GPT-4的試驗場,是因為這款遊戲自由度高且沒有過於明確的目標,AI如果想做到“玩得好”,那就需要進化出一些和人類玩家類似的能力,研究人員總結了幾個關鍵技能。
例如「根據其當前的技能水平和世界狀態提出適合的任務」——當身處沙漠時,AI會考慮先收集仙人掌而不是鐵礦。再例如「根據環境回饋改進技能,並將掌握的技能保存在記憶中」——作為敵人,殭屍與蜘蛛類似,那麼打殭屍總結的戰鬥經驗就可以用在蜘蛛上。
當然,教AI玩遊戲,最終試圖實現的目標還是在遊戲之外,研究人員表示透過這種方式訓練語言模型,將來或許可以使許多日常辦公任務自動化,或者根據用戶提出的需求來自動實現某些效果。
不過雖然前景美好,該實驗依舊還停留在初期階段,想真正把讓你頭痛的工作交給AI,或許還要等待一段時間。
參考資料:https://voyager.minedojo.org/
以上是把GPT-4連接到《我的世界》,科學家正在發掘AI的新潛力的詳細內容。更多資訊請關注PHP中文網其他相關文章!