搜尋
首頁科技週邊人工智慧攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

跑酷是一項極限運動,對機器人特別是四足機器狗來說,更是一項巨大的挑戰,需要在複雜的環境中快速克服各種障礙。一些研究嘗試使用參考動物數據或複雜的獎勵,但這些方法產生的「跑酷」技能要么多樣但盲目,要么基於視覺但特定於場景。然而,自主跑酷需要機器人學習基於視覺且多樣化的通用技能,以感知各種場景並迅速做出反應。

最近,一個機器狗跑酷的影片火了,影片中的機器狗在多種場景中迅速克服了各種障礙。例如,從鐵板下方的縫隙穿過,爬上木箱,再跳到另一個木箱上,一連串動作行雲流水:

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

##這串動作說明機器狗已經掌握了貼地爬行、攀爬和跳躍三個基本技能

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

#它還有一個特殊的技能:能夠傾斜擠過狹窄的縫隙

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

如果機器狗未能克服障礙,它會多試幾次:

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

#該內容已經被重寫成中文: 這款機器狗是基於一種為低成本機器人研發的「跑酷」技能學習框架。此框架由上海期智研究院、史丹佛大學、上海科技大學、CMU和清華大學的研究者共同提出,其研究論文已入選CoRL 2023(Oral)。本研究計畫已開源

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

論文網址:https://arxiv.org/abs/2309.05665

#計畫地址:https://github.com/ZiwenZhuang/parkour

#方法簡介

該研究推出了一種新的開源系統,用於學習基於視覺的端到端跑酷策略,以使用簡單的獎勵來學習多種跑酷技能,而無需任何參考運動數據。

具體來說,這項研究提出了一種強化學習方法,旨在讓機器人學會攀爬高障礙、跳過大間隙、在低障礙下爬行、擠過狹小縫隙和跑步等技能,並將這些技能轉化為基於單一視覺的跑酷策略。同時,透過使用以自我為中心的深度相機,將這些技能遷移到四足機器人上

#為了在低成本機器人上成功部署該研究提出的跑酷策略,只需使用機載計算(Nvidia Jetson)、機載深度攝影機(Intel Realsense)和機載電源,而不需要動作捕捉、雷射雷達、多個深度攝影機和大量計算

為了訓練跑酷策略,研究共進行如下三個階段的工作:

第一階段:強化學習預訓練,具備軟動態限制。研究採用自動課程讓機器人學習穿越障礙物,鼓勵機器人逐漸學會克服障礙

第二階段:具有 hard 動態限制的強化學習微調。研究在這個階段強制執行所有動態約束,並用現實動態(realistic dynamics)微調機器人在預訓練階段學到的行為。

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

第三階段:蒸餾。在學習了每個單獨的跑酷技能後,該研究使用DAgger 將它們蒸餾成一個基於視覺的跑酷策略(由RNN 參數化),該策略可以僅使用機載感知和計算部署到腿式機器人上。

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了


實驗及結果

在訓練中,該研究為每種技能設定了相應的障礙物尺寸,如下表1 所示:

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

該研究進行了大量的模擬和現實實驗,結果表明,跑酷策略使低成本四足機器人能夠自主選擇和執行適當的跑酷技能,僅使用機載計算、機載視覺感測和機載電源即可穿越開放世界中具有挑戰性的環境,包括爬高0.40m(1.53x 機器人高度)的障礙物,跳過0.60m(1.5x 機器人長度)的大間隙,在0.2m(0.76x 機器人高度)的低障礙物下爬行,透過傾斜擠過0.28m 的細縫(小於機器人寬度),可以一直跑步前進。

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

此外,研究也對所提出的方法與幾個基準方法進行了比較,並在模擬環境中進行了消融實驗。具體結果如表2所示:

攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了

如有興趣的讀者可閱讀原始論文,以深入了解更多研究內容

#

以上是攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗跑酷了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器