搜尋
首頁科技週邊人工智慧DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

但可能打不過公園裡的老大爺?

巴黎奧運會正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。

剛剛,DeepMind 提出了第一個在競技乒乓球比賽中達到人類業餘選手水平的學習型機器人智能體。

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

論文地址:https://arxiv.org/pdf/2408.03906

DeepMind 這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

正手反手都會:

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

對手採用多種打法,機器人也能招架得住:

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者
不過,比賽激烈程度似乎不如公園老闆對戰。

對機器人來說,乒乓球運動需要掌握複雜的低階技能和策略性玩法,需要長期訓練。 DeepMind 認為戰略上次優但可以熟練地執行低階技能可能是更好的選擇。這使乒乓球與國際象棋、圍棋等純粹的戰略遊戲區分開來。

因此,乒乓球是提升機器人能力的一個有價值的基準,包括高速運動、即時精確和戰略決策、系統設計以及與人類對手直接競爭。

對於這一點,Google DeepMind 首席科學家稱讚道:「乒乓球機器人將有助於我們解決高速控制和感知問題。」

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者
該研究進行了29 場機器人與人類的乒乓球比賽,其中機器人獲勝45% (13/29)。所有人類選手都是機器人未見過的玩家,從初學者到錦標賽選手能力不等。

雖然該機器人輸掉了所有與最高級別玩家的比賽,但它贏得了100% 的與初學者的比賽,在與中級選手的對戰中贏得了55% 的比賽,展現出人類業餘選手的水平。

總的來說,研究的貢獻包括:

  1. 提出一個分層和模組化的策略架構,其中包括:

  2. 低階控制器及其詳細的技能描述器,這些描述器對智能體的能力進行建模並有助於彌合模擬與真實的差距;

  3. 選擇低階技能的高階控制器。

  4. 實現零樣本模擬到真實的技術,包括定義基於現實世界的任務分佈的迭代方法,並定義自動課程(automatic curriculum)。

  5. 即時適應未見過的對手。

方法介紹

該智能體由一個低階技能庫和一個高階控制器組成。低階技能庫專注於乒乓球的某個特定方面,例如正手上旋球、反手瞄準或正手發球。除了包含訓練策略,研究還在線上下和線上收集和儲存有關每個低階技能的優勢、劣勢和限制的資訊。而負責協調低階技能的高階控制器會根據當前遊戲統計、技能描述選擇最佳技能。

此外,該研究還收集了少量的人類和人類對打的比賽數據,作為初始任務條件的種子,數據集包括位置、速度和旋轉的資訊。然後使用強化學習在模擬環境中訓練智能體, 並採用一些現有技術,將策略無縫部署到真實硬體中。 

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者
該智能體與人類一起對打以產生更多訓練數據,隨著機器人的持續學習,遊戲標準變得越來越複雜,以此讓智能體學習越來越複雜的動作。這種混合的「模擬 - 現實」循環創建了一個自動教學,使機器人的技能隨著時間的推移而不斷提高。 

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

Layered control

Layered control mainly includes the following parts:

  • Table tennis playing style: The high-level controller (HLC, high-level controller) first decides which playing style to use (forehand or Backhand);

  • Adjustment: Maintain each HLC's preference (H value) online based on statistics from matches against opponents;

  • Select the most effective skill: HLC pairs shortlisted players based on adjusted H value Sampling by LLC;

  • Updates: H-values ​​and opponent statistics are updated until the end of the game.

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

Results

The researchers compared the agent with 29 table tennis players of different levels, including beginners, intermediate, advanced and advanced + skills. Human players played three games against the robot according to standard table tennis rules, but the rules were slightly modified because the robot was unable to serve.

Facing all opponents, the robot won 45% of matches and 46% of games. Broken down by skill level, the bot won all its matches against beginners, lost all its matches against Advanced and Advanced+ players, and won 55% of its matches against Intermediate players. This shows that the agent reaches the level of an intermediate human player in table tennis rounds.

The reason why robots cannot beat advanced players is due to physical and technical limitations, including reaction speed, camera sensing capabilities, rotation processing, etc., which are difficult to accurately model in a simulation environment.

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

Sparring with robots is also very attractive

Research participants said that they enjoyed playing with robots very much and gave the robots high ratings in terms of "interesting" and "attractive" . They also unanimously expressed that they were "very willing" to fight the robot again. During free time, they played with the robot for an average of 4 minutes and 06 seconds over 5 minutes.

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者
DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

The robot is not good at backspin

The participant with the best skills mentioned that the robot is not good at handling backspin. To test this observation, the researchers plotted the robot's landing rate against the ball's spin, and the results showed that the robot's landing rate dropped significantly as it faced more backspin balls. This flaw is partly caused by the robot trying to avoid colliding with the table when handling low balls, and secondly by the fact that it is really difficult to determine the ball's spin in real time.

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者

Reference link:

https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&utm_content&pli=1

以上是DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新的最佳及時工程技術的年度彙編最新的最佳及時工程技術的年度彙編Apr 10, 2025 am 11:22 AM

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題

歐洲的AI大陸行動計劃:Gigafactories,Data Labs和Green AI歐洲的AI大陸行動計劃:Gigafactories,Data Labs和Green AIApr 10, 2025 am 11:21 AM

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。 一個關鍵要素是建立了AI Gigafactories網絡,每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟的直接代理商故事是否足以創造更多的粉絲?微軟的直接代理商故事是否足以創造更多的粉絲?Apr 10, 2025 am 11:20 AM

微軟對AI代理申請的統一方法:企業的明顯勝利 微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。 與許多技術公告陷入困境不同

向員工出售AI策略:Shopify首席執行官的宣言向員工出售AI策略:Shopify首席執行官的宣言Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

IBM啟動具有完整AI集成的Z17大型機IBM啟動具有完整AI集成的Z17大型機Apr 10, 2025 am 11:18 AM

IBM的Z17大型機:集成AI用於增強業務運營 上個月,在IBM的紐約總部,我收到了Z17功能的預覽。 以Z16的成功為基礎(於2022年推出並證明持續的收入增長

5 Chatgpt提示取決於別人並完全相信自己5 Chatgpt提示取決於別人並完全相信自己Apr 10, 2025 am 11:17 AM

解鎖不可動搖的信心,消除了對外部驗證的需求! 這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。 只需複制,粘貼和自定義包圍

AI與您的思想危險相似AI與您的思想危險相似Apr 10, 2025 am 11:16 AM

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相,展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。 窺探內部:Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展,該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼,而是理解它在人工神經元層面如何做到這一點。 想像一下,試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A

龍翼展示高通的邊緣動力龍翼展示高通的邊緣動力Apr 10, 2025 am 11:14 AM

高通的龍翼:企業和基礎設施的戰略飛躍 高通公司通過其新的Dragonwing品牌在全球範圍內積極擴展其範圍,以全球為目標。 這不僅僅是雷布蘭

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中