首頁  >  文章  >  科技週邊  >  認真的嗎?讓機器狗當守門員,還發了篇論文

認真的嗎?讓機器狗當守門員,還發了篇論文

王林
王林轉載
2023-04-12 18:34:03909瀏覽

讓一個機器狗擔任足球守門員,可靠嗎?靠不靠譜,我們先看看效果在下結論。

工作人員一次很溫和的進攻,機器狗攔住了球:

認真的嗎?讓機器狗當守門員,還發了篇論文

加點難度,來個拋物線進球,也不再話下:

認真的嗎?讓機器狗當守門員,還發了篇論文

#用手拋球有作弊嫌疑?用腳試試,機器狗也能把球門守的死死的

認真的嗎?讓機器狗當守門員,還發了篇論文

#有趣的是,該研究還嘗試讓一隻機器狗踢球,另一隻當守門員,兩隻機器狗自己也能玩挺好:

認真的嗎?讓機器狗當守門員,還發了篇論文

看完效果,感覺機器狗當守門員還挺靠譜。這款機器狗是MIT 在2019 年研發的Mini Cheetah,現在來自加州大學柏克萊分校等機構的研究者為Mini Cheetah 部署了一個新的強化學習框架,讓它完成足球守門任務,守門成功率高達87.5% 。

論文網址:https://arxiv.org/pdf/2210.04435.pdf

4 公尺開外踢球

Mini Cheetah 只用不到1 秒成功守門

讓Mini Cheetah 學會守門還是一件比較難的事,因為這涉及物體(例如球)拋出的高度以及動態移動的位置,具體而言,一方操縱一個快速移動的球,球的方向和位置不確定,而另一方需要迅速判斷球的位置以阻止進球。想要完成這項任務,需要教導機器人動態移動它的身體,同時確保它的腳 (或臉) 到達它們需要及時阻擋球的地方,這基本上是將兩個難題結合在一起。

該研究的解決方案是將運動控制器與末端執行器軌跡規劃相結合,這樣一來就可以找到最佳的方法讓Mini Cheetah 在球到達目標不到一秒的時間內,進行阻擋。

完成上述過程,還需要訓練Mini Cheetah 掌握一套有用的守門員技能,例如Mini Cheetah 需要掌握在地面附近和靠近地面的地方對球進行側身攔截、掌握俯衝到達球門的下角技術、跳躍到球門的頂部和上角。完成這些動作,Mini Cheetah 都可以恢復並最終安全著陸。每個技能的參考動作都是手動編程的,在模擬中進行訓練,然後直接遷移到機器人。

Mini Cheetah 防守的球門寬 1.5m,高 0.9m,球(3 號)從約 4m 外踢出,球被外部跟踪,然後 Mini Cheetah 攔球。讓這麼小的機器狗完成攔球動作,表現是令人印象深刻的。

認真的嗎?讓機器狗當守門員,還發了篇論文

該研究表明,這款機器狗系統可以將在模擬中學習到的動態動作和守門員技能遷移到一個真正的四足機器人上,在現實世界中,對隨機射門的守門成功率為87.5%。而人類足球守門員的平均成功率是 69%。研究人員表示,他們所提出的框架可以擴展到其他場景,例如多技能足球。

下面我們來看看支持這台機器狗的背後框架。

分層強化學習框架

首先,讓四足機器人成為足球守門員是一個很有挑戰性的問題,因為它必須同時解決預測物體運動軌跡和機器人捕獲非抓握物體(球體)兩個實際問題。機器人需要在很短的時間內(通常不到一秒)對空中飛行的球做出反應並攔截。

為了完成這個挑戰,研究團隊提出了一個分層無模型強化學習 (RL) 框架。該框架包含一個針對不同運動技能的多個控制策略,涵蓋了目標的不同區域。

認真的嗎?讓機器狗當守門員,還發了篇論文

這些控制策略讓機器人能夠追蹤隨機參數化末端執行器的軌跡,同時執行特定的運動技能,例如跳躍攔球、撲球和順勢攔住地面滾動的球。

認真的嗎?讓機器狗當守門員,還發了篇論文

RL 框架中包含一個高階規劃器,它可協助機器人確定所需的運動技能和規劃末端執行器軌跡,以攔截飛向不同目標區域的球。

該研究在MIT 2019 年提出的Mini Cheetah 四足機器人上部署了上述RL 框架,實驗表明這種RL 框架能夠讓四足機器人有效攔截現實世界中快速移動的球。

認真的嗎?讓機器狗當守門員,還發了篇論文

先前對四足機器人 RL 框架的研究主要集中在低階運動控制上,例如讓機器人以要求速度步行、模仿參考運動。而研究提出的框架將學習到的運動技能擴展到更高級別的任務上,成功使用高級規劃讓四足機器人以敏捷的動作精確攔截快速移動的足球。這對四足機器人的高階規劃控制具有重要意義。

以上是認真的嗎?讓機器狗當守門員,還發了篇論文的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除