搜尋
首頁科技週邊人工智慧四分鐘對打300多次,Google教會機器人打乒乓球

讓一位乒乓球愛好者和機器人對打,按照機器人的發展趨勢來看,誰輸誰贏還真說不準。

機器人擁有靈巧的可操作性、腿部運動靈活、抓握能力出色… 已被廣泛應用於各種挑戰任務。但在與人類互動緊密的任務中,機器人的表現又是如何呢?就拿乒乓球來說,這需要雙方高度配合,而且球的運動非常快速,這對演算法提出了重大挑戰。

在乒乓球比賽中,首要的就是速度和精準度,這對學習演算法提出了很高的要求。同時,這項運動具有高度結構化(具有固定的、可預測的環境)和多智能體協作(機器人可以與人類或其他機器人一起對打)兩大特點,使其成為研究人機互動和強化學習問題的理想實驗平台。

來自Google的機器人研究團隊已經建立了這樣一個平台來研究機器人在多人、動態和互動環境中學習所面臨的問題。谷歌為此也特別寫了一篇博客,來介紹他們一直在研究的兩個項目 Iterative-Sim2Real(i-S2R) 和 GoalsEye。 i-S2R 讓機器人能夠與人類玩家進行超過 300 次的對打,而 GoalsEye 則使機器人能夠從業餘愛好者那裡學習到一些有用的策略(目標條件策略)。

i-S2R 策略讓機器人和人類對打,雖然機器人的握拍姿勢看起來不太專業,但也不會漏掉一個球:

四分鐘對打300多次,Google教會機器人打乒乓球

#你來我往,還挺像那麼回事,妥妥打出了高質量球的感覺。

而GoalsEye 策略則能將球回到桌面指定位置,就和指哪打哪差不多:

四分鐘對打300多次,Google教會機器人打乒乓球

i-S2R:利用模擬器與人類合作進行遊戲

在這個計畫中,機器人旨在學習與人類合作,即盡可能長時間地與人類進行對打。由於直接針對人類玩家進行訓練既乏味又耗時,因此Google採用了基於模擬的方法。然而,這又面臨一個新的問題,基於模擬的方法很難準確地模擬人類行為、閉環互動任務等。

在 i-S2R 中,Google提出了一種在人機互動任務中可以學習人類行為的模型,並在機器人乒乓球平台上對其進行實例化。谷歌已經建立了一個系統,可以與業餘人類玩家一起實現高達 340 次擊球對打(如下所示)。

四分鐘對打300多次,Google教會機器人打乒乓球

人與機器人對打4 分鐘,來回多達340 次

##學習人類行為模式

讓機器人準確的學習人類行為還面臨以下問題:如果一開始就沒有足夠好的機器人策略,就無法收集關於人類如何與機器人互動的高品質數據。但如果沒有人類行為模型,從一開始就無法獲得機器人策略,這個問題有點繞,就像先有雞還是先有蛋的問題。一種方法是直接在現實世界中訓練機器人策略,但這通常很慢,成本高昂,並且會帶來與安全相關的挑戰,當人們參與其中時,這些挑戰會進一步加劇。

如下圖所示,i-S2R 使用一個簡單的人類行為模型作為近似起點,並在模擬訓練和現實世界部署之間交替進行。每次迭代中,人類行為模型和策略都會被調整。

四分鐘對打300多次,Google教會機器人打乒乓球#

i-S2R 方法

#Google根據玩家類型對實驗結果進行了細分:初學者(佔40% 的玩家)、中級(佔40% 的玩家)和高級(佔20% 的玩家)。由實驗結果可得,對於初學者和中級玩家(佔 80% 的玩家),i-S2R 的表現都明顯優於 S2R FT(sim-to-real plus fine-tuning)。

四分鐘對打300多次,Google教會機器人打乒乓球

以玩家類型分割的i-S2R 結果

GoalsEye:可精確擊中指定位置

在GoalsEye 中,Google也展示了一種方法,該方法結合了行為克隆技術(behavior cloning techniques)來學習精確的目標定位策略。

這裡Google重點關注乒乓球的精確度,他們希望機器人可以將小球精確地回到球檯上的任意指定位置,就如下圖所顯示的指哪打哪。為實現以下效果,他們也採用了 LFP(Learning from Play)、GCSL(Goal-Conditioned Supervised Learning)。

四分鐘對打300多次,Google教會機器人打乒乓球

GoalsEye 策略瞄準直徑 20cm 的圓圈(左)。人類玩家可以瞄準同樣的目標(右)

#在最初的2480 次演示中,Google的訓練策略僅在9% 的時間內準確地擊中半徑為30 公分的圓形目標。在經過了大約 13500 次演示後,小球達到目標的準確率上升到 43%(右下圖)。

四分鐘對打300多次,Google教會機器人打乒乓球

關於這兩個項目的更多介紹,請參考以下連結:

  • #Iterative-Sim2Real 首頁:https://sites.google.com/view/is2r
  • GoalsEye 首頁:https://sites.google.com /view/goals-eye

以上是四分鐘對打300多次,Google教會機器人打乒乓球的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
火箭發射模擬和分析使用Rocketpy -Analytics Vidhya火箭發射模擬和分析使用Rocketpy -Analytics VidhyaApr 19, 2025 am 11:12 AM

模擬火箭發射的火箭發射:綜合指南 本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。 我們將介紹從定義火箭組件到分析模擬的所有內容

5個免費數據分析課程 - 分析Vidhya5個免費數據分析課程 - 分析VidhyaApr 19, 2025 am 11:11 AM

踏上數據驅動的職業旅程而不會破壞銀行! 本文重點介紹了五個非凡的免費數據分析課程,非常適合兩位經驗豐富的專業人士,他們尋求擴大技能和好奇的新手渴望探索T

如何使用OpenAgi構建自主AI代理? - 分析Vidhya如何使用OpenAgi構建自主AI代理? - 分析VidhyaApr 19, 2025 am 11:10 AM

利用AI代理商的力量與OpenAgi:綜合指南 想像一下不懈的助手,總是可以簡化您的任務並提供有見地的建議。這就是AI代理商的承諾,Openagi賦予您建造它們

GPT-4O MINI:OpenAI的最新模型如何堆疊?GPT-4O MINI:OpenAI的最新模型如何堆疊?Apr 19, 2025 am 11:09 AM

Openai的最新產品GPT-4O Mini標誌著朝著負擔得起且可訪問的高級AI邁出的重要一步。 這種小型語言模型(SLM)直接挑戰諸如Llama 3和Gemma 2之類的競爭對手,具有低潛伏期,成本效益和A

從技術創新者到醫療保健先驅:Geetha Manjunath博士的AI故事從技術創新者到醫療保健先驅:Geetha Manjunath博士的AI故事Apr 19, 2025 am 11:02 AM

Niramai Analytix的創始人兼首席執行官Geetha Manjunath博士的這一集由“領導數據”的劇集。 Manjunath博士擁有AI和Healthcare的25年以上的經驗,並獲得了印度科學學院的博士學位和MBA來回。

用Ollama -Analytics Vidhya簡化本地LLM部署用Ollama -Analytics Vidhya簡化本地LLM部署Apr 19, 2025 am 11:01 AM

利用Ollama本地開源LLMS的力量:綜合指南 運行大型語言模型(LLMS)本地提供無與倫比的控制和透明度,但是設置環境可能令人生畏。 Ollama簡化了這個過程

如何使用Monsterapi微調大語言模型如何使用Monsterapi微調大語言模型Apr 19, 2025 am 10:49 AM

利用微調LLM的功能與Monsterapi:綜合指南 想像一個虛擬助手完美理解並預測您的需求。 由於大型語言模型(LLMS)的進步,這已成為現實。 但是,

5統計測試每個數據科學家都應該知道-Analytics Vidhya5統計測試每個數據科學家都應該知道-Analytics VidhyaApr 19, 2025 am 10:27 AM

數據科學的基本統計測試:綜合指南 從數據中解鎖有價值的見解至關重要。 掌握統計測試對於實現這一目標至關重要。這些測試使數據科學家能夠嚴格瓦爾

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。