CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！-人工智能-PHP中文网

首页

科技周边

人工智能

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

王林

Feb 05, 2024 pm 04:33 PM

产业机器人技术卡内基梅隆大学

CMU和ETH Zurich团队合作开发了名为"敏捷但安全"（ABS）的新框架，为四足机器人在复杂环境中实现高速运动提供了解决方案。该框架不仅在避免碰撞方面表现出高效能力，而且实现了前所未有的3.1毫秒极速运动。这一创新为足式机器人领域带来了新的进展。

在高速机器人运动领域，同时保持速度和安全性一直是一个巨大的挑战。然而，卡内基梅隆大学（CMU）和苏黎世联邦理工学院（ETH）的研究团队最近取得了突破性进展。他们开发的全新四足机器人算法不仅能够快速移动于复杂环境中，还能巧妙地避开障碍物，真正实现了“敏捷且安全”的目标。这项算法的创新之处在于它能够快速地识别和分析周围环境，并根据实时数据做出智能决策。通过使用先进的传感器和强大的计算能力，机器人能够准确地感知周围的障碍物，并通过调整步态和轨迹来避开它们。这项技术的成功应用将极大地推动高速机器人的发展

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

论文地址: https://arxiv.org/pdf/2401.17583.pdf

在 ABS 的加持下，机器狗在各种场景下都展现出了惊艳的高速避障能力：

障碍重重的狭窄走廊：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

凌乱的室内场景：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

无论是草地还是户外，静态或动态障碍，机器狗都从容应对：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

遇见婴儿车，机器狗灵巧躲闪开：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

警告牌、箱子、椅子也都不在话下：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

对于突然出现的垫子和人脚，也能轻松绕过：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

机器狗甚至还可以玩老鹰捉小鸡：

CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

ABS 突破性技术：

RL+ Learning model-free Reach-Avoid value

ABS 采用了一种双策略（Dual Policy）设置，包括一个「敏捷策略」（Agile Policy）和一个「恢复策略」（Recovery Policy）。敏捷策略让机器人在障碍环境中快速移动，而一旦 Reach-Avoid Value Estimation 检测到潜在危险（比如突然出现的婴儿车），恢复策略就会介入，确保机器人安全。

创新点 1：怎么训练一个敏捷策略 Agile Policy？

敏捷策略的创新之处在于，与以往简单地追踪速度指令不同，它采用目标达成（position trakcing）的形式来最大化机器人的敏捷性。这一策略训练机器人发展出感知运动技能，以在没有碰撞的情况下达到指定目标。通过追求基座高速度的奖励条件，机器人自然学会在避免碰撞的同时实现最大敏捷性。这种方法克服了传统速度追踪（velocity tracking）策略在复杂环境中可能的保守限制，有效提高了机器人在障碍环境中的速度和安全性。Agile Policy 在实机测试中极速达到了 3.1m/s

创新点 2：学习 Policy-conditioned reach-avoid value

「达防」（Reach-Avoid, RA）值学习的创新之处在于，它采用了无模型的方式学习，与传统的基于模型的可达性分析方法不同，更适合无模型的强化学习策略。此方法不是学习全局 RA 值，而是使其依赖于特定策略，这样可以更好地预测敏捷策略的失败。通过简化的观测集，RA 值网络可以有效地概括并预测安全风险。RA 值被用于指导恢复策略，帮助机器人优化运动以避免碰撞，从而实现在保证安全的同时提高敏捷性的目标。

下图展示了针对特定障碍物集合学习到的 RA（达防）值。随着机器人速度的变化，RA 值的分布景观也相应变化。RA 值的符号合理地指示了敏捷策略的安全性。换句话说，这张图通过不同的 RA 值展示了机器人在不同速度下，面对特定障碍物时的安全风险程度。RA 值的高低变化反映了机器人在不同状态下执行敏捷策略时可能遇到的安全风险。

创新点 3：用 Reach-Avoid Value 和恢复策略来拯救机器人

恢复策略的创新之处在于，它能使四足机器人快速追踪线速度和角速度指令，作为一种备用保护策略。与敏捷策略不同，恢复策略的观测空间专注于追踪线速度和角速度命令，不需要外部感知信息。恢复策略的任务奖励专注于线性速度追踪、角速度追踪、保持存活和保持姿势，以便平滑切换回敏捷策略。这种策略的训练同样在仿真环境中进行，但有特定的域随机化和课程设置，以更好地适应可能触发恢复策略的状态。这种方法为四足机器人提供了在高速运动中快速应对潜在失败的能力。

下图展示了当恢复策略在两个特定情况（I 和 II）下被触发时，RA（达防）值景观的可视化展示。这些可视化展示是在 vx（沿 x 轴的速度）与 ωz（绕 z 轴的角速度）平面以及 vx 与 vy（沿 y 轴的速度）平面上进行的。图中显示了搜索前的初始旋转状态（即机器人基座当前的旋转状态）和通过搜索得到的命令。简单来说，这些图表展示了在特定条件下，通过恢复策略搜索得到的最佳运动指令，以及这些指令如何影响 RA 值，从而反映机器人在不同运动状态下的安全性。

鲁棒性测试

作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性，机器狗都从容应对：

研究团队

这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机器人技术领域取得了重大突破，更开启了四足机器人新的应用可能。这项技术的成功展示了四足机器人在高速移动和安全避障领域的巨大潜力。未来，这种高速且安全的四足机器人有望在搜救、探险甚至是家庭服务等多个领域发挥重要作用。

以上是CMUÐ实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：机器之心。如有侵权，请联系admin@php.cn删除

最新的最佳及时工程技术的年度汇编Apr 10, 2025 am 11:22 AM

对于那些可能是我专栏新手的人，我广泛探讨了AI的最新进展，包括体现AI，AI推理，AI中的高科技突破，及时的工程，AI培训，AI，AI RE RE等主题

欧洲的AI大陆行动计划：Gigafactories，Data Labs和Green AIApr 10, 2025 am 11:21 AM

欧洲雄心勃勃的AI大陆行动计划旨在将欧盟确立为人工智能的全球领导者。一个关键要素是建立了AI Gigafactories网络，每个网络都有大约100,000个高级AI芯片 - 2倍的自动化合物的四倍

微软对AI代理申请的统一方法：企业的明显胜利微软最近公告的新AI代理能力清晰而统一的演讲给人留下了深刻的印象。与许多技术公告陷入困境不同

向员工出售AI策略：Shopify首席执行官的宣言Apr 10, 2025 am 11:19 AM

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。这不是短暂的趋势。这是整合到P中的新操作范式

IBM启动具有完整AI集成的Z17大型机Apr 10, 2025 am 11:18 AM

IBM的Z17大型机：集成AI用于增强业务运营上个月，在IBM的纽约总部，我收到了Z17功能的预览。以Z16的成功为基础（于2022年推出并证明持续的收入增长

5 Chatgpt提示取决于别人并完全相信自己Apr 10, 2025 am 11:17 AM

解锁不可动摇的信心，消除了对外部验证的需求！这五个CHATGPT提示将指导您完全自力更生和自我感知的变革转变。只需复制，粘贴和自定义包围

AI与您的思想危险相似Apr 10, 2025 am 11:16 AM

人工智能安全与研究公司 Anthropic 最近的一项[研究]开始揭示这些复杂过程的真相，展现出一种令人不安地与我们自身认知领域相似的复杂性。自然智能和人工智能可能比我们想象的更相似。窥探内部：Anthropic 可解释性研究 Anthropic 进行的研究的新发现代表了机制可解释性领域的重大进展，该领域旨在反向工程 AI 的内部计算——不仅仅观察 AI 做了什么，而是理解它在人工神经元层面如何做到这一点。想象一下，试图通过绘制当有人看到特定物体或思考特定想法时哪些神经元会放电来理解大脑。A