搜索
首页科技周边人工智能攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

跑酷是一项极限运动,对机器人特别是四足机器狗来说,更是一项巨大的挑战,需要在复杂的环境中快速克服各种障碍。一些研究尝试使用参考动物数据或复杂的奖励,但这些方法生成的「跑酷」技能要么多样但盲目,要么基于视觉但特定于场景。然而,自主跑酷需要机器人学习基于视觉且多样化的通用技能,以感知各种场景并迅速做出反应。

最近,一个机器狗跑酷的视频火了,视频中的机器狗在多种场景中迅速克服了各种障碍。例如,从铁板下方的缝隙穿过,爬上木箱,再跳到另一个木箱上,一连串动作行云流水:

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

这串动作说明机器狗已经掌握了贴地爬行、攀爬和跳跃三个基本技能

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

它还有一个特殊的技能:能够倾斜挤过狭窄的缝隙

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

如果机器狗未能克服障碍,它会多试几次:

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

该内容已经被重写成中文: 这款机器狗是基于一种为低成本机器人研发的「跑酷」技能学习框架。该框架由上海期智研究院、斯坦福大学、上海科技大学、CMU和清华大学的研究者联合提出,并且其研究论文已入选CoRL 2023(Oral)。该研究项目已经开源

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

论文地址:https://arxiv.org/abs/2309.05665

项目地址:https://github.com/ZiwenZhuang/parkour

方法简介

该研究推出了一种新的开源系统,用于学习基于视觉的端到端跑酷策略,以使用简单的奖励来学习多种跑酷技能,而无需任何参考运动数据。

具体来说,这项研究提出了一种强化学习方法,旨在让机器人学会攀爬高障碍、跳过大间隙、在低障碍下爬行、挤过狭小缝隙和跑步等技能,并将这些技能转化为基于单一视觉的跑酷策略。同时,通过使用以自我为中心的深度相机,将这些技能迁移到四足机器人上

为了在低成本机器人上成功部署该研究提出的跑酷策略,只需使用机载计算(Nvidia Jetson)、机载深度摄像头(Intel Realsense)和机载电源,而不需要动作捕捉、激光雷达、多个深度摄像头和大量计算

为了训练跑酷策略,该研究共进行了如下三个阶段的工作:

第一阶段:强化学习预训练,具备软动态约束。该研究采用自动课程让机器人学习穿越障碍物,鼓励机器人逐渐学会克服障碍

第二阶段:具有 hard 动态约束的强化学习微调。该研究在这个阶段强制执行所有动态约束,并用现实动态(realistic dynamics)微调机器人在预训练阶段学到的行为。

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

第三阶段:蒸馏。在学习了每个单独的跑酷技能后,该研究使用 DAgger 将它们蒸馏成一个基于视觉的跑酷策略(由 RNN 参数化),该策略可以仅使用机载感知和计算部署到腿式机器人上。

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了


实验及结果

在训练中,该研究为每种技能设置了相应的障碍物尺寸,如下表 1 所示:

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

该研究进行了大量的模拟和现实实验,结果表明,跑酷策略使低成本四足机器人能够自主选择和执行适当的跑酷技能,仅使用机载计算、机载视觉传感和机载电源即可穿越开放世界中具有挑战性的环境,包括爬高 0.40m(1.53x 机器人高度)的障碍物,跳过 0.60m(1.5x 机器人长度)的大间隙,在 0.2m(0.76x 机器人高度)的低障碍物下爬行,通过倾斜挤过 0.28m 的细缝(小于机器人宽度),并且可以一直跑步前行。

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

此外,研究还对所提出的方法与几种基线方法进行了比较,并在模拟环境中进行了消融实验。具体结果如表2所示:

攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了

如有兴趣的读者可阅读原始论文,以深入了解更多研究内容

以上是攀爬、跳跃、过窄缝,开源强化学习策略让机器狗能跑酷了的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
微软工作趋势指数2025显示工作场所容量应变微软工作趋势指数2025显示工作场所容量应变Apr 24, 2025 am 11:19 AM

由于AI的快速整合而加剧了工作场所的迅速危机危机,要求战略转变以外的增量调整。 WTI的调查结果强调了这一点:68%的员工在工作量上挣扎,导致BUR

AI可以理解吗?中国房间的论点说不,但是对吗?AI可以理解吗?中国房间的论点说不,但是对吗?Apr 24, 2025 am 11:18 AM

约翰·塞尔(John Searle)的中国房间论点:对AI理解的挑战 Searle的思想实验直接质疑人工智能是否可以真正理解语言或具有真正意识。 想象一个人,对下巴一无所知

中国的'智能” AI助手回应微软召回的隐私缺陷中国的'智能” AI助手回应微软召回的隐私缺陷Apr 24, 2025 am 11:17 AM

与西方同行相比,中国的科技巨头在AI开发方面的课程不同。 他们不专注于技术基准和API集成,而是优先考虑“屏幕感知” AI助手 - AI T

Docker将熟悉的容器工作流程带到AI型号和MCP工具Docker将熟悉的容器工作流程带到AI型号和MCP工具Apr 24, 2025 am 11:16 AM

MCP:赋能AI系统访问外部工具 模型上下文协议(MCP)让AI应用能够通过标准化接口与外部工具和数据源交互。由Anthropic开发并得到主要AI提供商的支持,MCP允许语言模型和智能体发现可用工具并使用合适的参数调用它们。然而,实施MCP服务器存在一些挑战,包括环境冲突、安全漏洞以及跨平台行为不一致。 Forbes文章《Anthropic的模型上下文协议是AI智能体发展的一大步》作者:Janakiram MSVDocker通过容器化解决了这些问题。基于Docker Hub基础设施构建的Doc

使用6种AI街头智能策略来建立一家十亿美元的创业使用6种AI街头智能策略来建立一家十亿美元的创业Apr 24, 2025 am 11:15 AM

有远见的企业家采用的六种策略,他们利用尖端技术和精明的商业敏锐度来创造高利润的可扩展公司,同时保持控制权。本指南是针对有抱负的企业家的,旨在建立一个

Google照片更新解锁了您所有图片的惊人Ultra HDRGoogle照片更新解锁了您所有图片的惊人Ultra HDRApr 24, 2025 am 11:14 AM

Google Photos的新型Ultra HDR工具:改变图像增强的游戏规则 Google Photos推出了一个功能强大的Ultra HDR转换工具,将标准照片转换为充满活力的高动态范围图像。这种增强功能受益于摄影师

Descope建立AI代理集成的身份验证框架Descope建立AI代理集成的身份验证框架Apr 24, 2025 am 11:13 AM

技术架构解决了新兴的身份验证挑战 代理身份集线器解决了许多组织仅在开始AI代理实施后发现的问题,即传统身份验证方法不是为机器设计的

Google Cloud Next 2025以及现代工作的未来Google Cloud Next 2025以及现代工作的未来Apr 24, 2025 am 11:12 AM

(注意:Google是我公司的咨询客户,Moor Insights&Strateging。) AI:从实验到企业基金会 Google Cloud Next 2025展示了AI从实验功能到企业技术的核心组成部分的演变,

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),