UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

May 22, 2023 pm 10:22 PM

ai機器

最近，來自UCSD、IAIFI和MIT機構的研究人員，用一種全新的神經體積記憶架構（NVM），教會了一隻機器狗感知三維世界。

利用這項技術，機器狗可以透過單一的神經網路實現爬樓梯、跨縫隙、翻障礙等等——完全自主，無需遙控。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

不知道你有沒有註意到狗背上那個的白盒子？

裡面搭載的是蘋果的M1晶片，負責執行機器狗的視覺處理任務。而且，還是團隊從Mac上拆下來的。

不難看出，MIT的這隻機器狗可以輕鬆地爬過了橫在自己面前一段樹枝，毫不費力（基本上）。

長了4隻腳的MacBook？

眾所周知，對於機器狗，以及其他有腿的機器人來說，想要翻越不平整的道路，可謂是困難重重。

路面狀況越是複雜，就有越多的障礙物無法被看見。

為了解決「部分可觀測環境」問題，目前SOTA的視覺-運動技術透過框架堆疊（frame-stacking），將影像通道連接起來。

然而，這種簡單的處理方法遠遠落後於現在的電腦視覺技術——後者可以明確地模擬光流和特定的3D幾何形狀。

受此啟發，團隊提出了一種神經體積記憶架構（NVM），可以充分考慮到三維世界的SE(3)等變性（Equivalence）。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

計畫網址：https://rchalyang.github.io/NVM/

與以往的方法不同，NVM是一種體積格式。它可以將來自多個相機視圖的特徵體積聚合到機器人的自我中心框架中，讓機器人能更好地理解周圍的環境。

測試的結果顯示，使用神經體積記憶（NVM）對腿部運動進行訓練後，機器人在複雜的地形上的表現要明顯優於先前的技術。

此外，消融實驗的結果顯示，神經體積記憶中儲存的內容捕捉了足夠的幾何資訊來重構3D場景。

現實世界中的實驗

為了在模擬之外的不同現實世界場景中進行驗證，團隊在室內和室外場景中都進行了實驗。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

當機器狗發現有障礙物突然出現在自己面前時，直接就會選擇繞開。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

在滿是石頭的地面上，走起來好像也沒什麼問題，雖然比在平地上還是要費力一些的。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

相對於自身來說比較大的障礙，努努力還是可以翻過去的。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

採用先前的辨識控制技術，小狗後腿對距離判斷明顯出現了誤差，一腳踩溝裡翻車了，失敗。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

採用MIT提出的NVM之後，小狗過溝，穩穩的幸福，成功！

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

採用先前的辨識控制技術，小狗第一腳就踩空了，狗頭搶地，失敗。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

採用MIT提出的NVM之後，小狗四平穩地走過了矩陣。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

「腿部運動的體積記憶

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

# #使用以自我為中心的攝影機視角，本質上是一個處理「部分可觀測環境」的問題（Partially-Observed）。

為了使控制問題具體化，機器人需要從先前的幀中收集信息，並正確推斷被遮擋的地形。

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

在運動過程中，直接安裝在機器人底盤上的攝影機發生劇烈和突然的位置變化。

這樣，在表徵一連串的畫面的過程中，某單一影格能夠被放到正確的位置，就變得非常重要了。

為此，團隊提出的神經體積記憶（NVM）的概念，可以將輸入的一連串視覺訊息，轉化為場景特徵進行3D描繪，進而進行輸出。

透過自監督學習NVM

雖然「行為複製目標」足以產生一個好的策略，但針對平移和旋轉的等變性，自動為神經體積記憶提供了一個獨立的、自我監督的學習目標。

########################自監督學習：研究團隊訓練了一個獨立的解碼器。讓它透過一段視覺觀察和兩個影格之間的預估轉換，來預測不同影格中的視覺觀察。 ###############如上圖所示，可以假設在影格之間周圍的3D場景保持不變。由於相機是朝前看的，我們可以將先前幀的特徵體積規範化，並用它來預測後續的影像。 ############解碼器的視覺重建############第一幅圖顯示機器人在環境中移動，第二幅圖是輸入的視覺觀察結果，第三幅圖是使用3D特徵體積和預估畫面合成的視覺觀察效果。 ############對於輸入的視覺觀察，研究團隊對影像應用了大量的資料增強來提高模型的穩健性。 ######

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

#作者介紹

Ruihan Yan

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

Ruihan Yan是加州大學聖地牙哥分校的二年級博士生。在此之前，他於2019年在南開大學獲得軟體工程學士學位

他的研究興趣是強化學習、機器學習、機器人等。具體來說，他想建立智能體，利用來自不同來源的資訊進行決策。

Ge Yang

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

#Ge Yang本科畢業於耶魯大學物理和數學專業，並在芝加哥大學獲得物理學博士學位。目前是美國國家科學基金會人工智慧與基礎交互作用研究所（IAIFI）的博士後研究員。

Ge Yang的研究涉及兩組相關問題。第一組是透過重新檢視我們在神經網路中表徵知識的方式，以及知識如何在分佈中轉移，來改善學習。第二組是透過理論工具的觀點來看待強化學習，如神經正切核、非歐幾里德幾何和哈密頓動力學。

Xiaolong Wang

UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能

Xiaolong Wang是加州大學聖地牙哥分校ECE系的助理教授。他是TILOS國家科學基金會人工智慧研究所的機器人團隊的成員。

他在卡內基美隆大學獲得了機器人學的博士學位，並曾在加州大學柏克萊分校做博士後研究。

以上是UCSD、MIT等華人團隊教機器狗感知3D世界！搭M1晶片，爬樓跨障無所不能的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

如何使用Huggingface Smollm建立個人AI助手

如何使用Huggingface Smollm建立個人AI助手Apr 18, 2025 am 11:52 AM

利用“設備” AI的力量：建立個人聊天機器人CLI 在最近的過去，個人AI助手的概念似乎是科幻小說。想像一下科技愛好者亞歷克斯（Alex）夢見一個聰明的本地AI同伴 - 不依賴

通過斯坦福大學激動人心的新計劃，精神健康的AI專心分析

通過斯坦福大學激動人心的新計劃，精神健康的AI專心分析Apr 18, 2025 am 11:49 AM

他們的首屆AI4MH發射於2025年4月15日舉行，著名的精神科醫生兼神經科學家湯姆·因斯爾（Tom Insel）博士曾擔任開幕式演講者。 Insel博士因其在心理健康研究和技術方面的傑出工作而聞名

2025年WNBA選秀課程進入聯盟成長並與在線騷擾作鬥爭

2025年WNBA選秀課程進入聯盟成長並與在線騷擾作鬥爭Apr 18, 2025 am 11:44 AM

恩格伯特說：“我們要確保WNBA仍然是每個人，球員，粉絲和公司合作夥伴，感到安全，重視和授權的空間。” anno

Python內置數據結構的綜合指南 - 分析Vidhya

Python內置數據結構的綜合指南 - 分析VidhyaApr 18, 2025 am 11:43 AM

介紹 Python擅長使用編程語言，尤其是在數據科學和生成AI中。在處理大型數據集時，有效的數據操作（存儲，管理和訪問）至關重要。我們以前涵蓋了數字和ST

與替代方案相比，Openai新型號的第一印象

與替代方案相比，Openai新型號的第一印象Apr 18, 2025 am 11:41 AM

潛水之前，一個重要的警告：AI性能是非確定性的，並且特定於高度用法。簡而言之，您的里程可能會有所不同。不要將此文章（或任何其他）文章作為最後一句話 - 目的是在您自己的情況下測試這些模型

AI投資組合|如何為AI職業建立投資組合？

AI投資組合|如何為AI職業建立投資組合？Apr 18, 2025 am 11:40 AM

建立杰出的AI/ML投資組合：初學者和專業人士指南創建引人注目的投資組合對於確保在人工智能（AI）和機器學習（ML）中的角色至關重要。本指南為建立投資組合提供了建議

代理AI對安全操作可能意味著什麼

代理AI對安全操作可能意味著什麼Apr 18, 2025 am 11:36 AM

結果？倦怠，效率低下以及檢測和作用之間的差距擴大。這一切都不應該令任何從事網絡安全工作的人感到震驚。不過，代理AI的承諾已成為一個潛在的轉折點。這個新課

Google與Openai：AI為學生打架

Google與Openai：AI為學生打架Apr 18, 2025 am 11:31 AM

直接影響與長期夥伴關係？兩週前，Openai提出了強大的短期優惠，在2025年5月底之前授予美國和加拿大大學生免費訪問Chatgpt Plus。此工具包括GPT-4O，A A A A A

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

1 個月前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳圖形設置

1 個月前By尊渡假赌尊渡假赌尊渡假赌

刺客信條陰影：貝殼謎語解決方案

3 週前ByDDD

Windows 11 KB5054979中的新功能以及如何解決更新問題

2 週前ByDDD

威爾R.E.P.O.有交叉遊戲嗎？

1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合，這些清單在安全評估過程中經常使用，而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表，幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上，他就可以存取所需的每種類型的清單。

SublimeText3漢化版

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中，你可以繼續在那裡關注我們。 MinGW：GNU編譯器集合（GCC）的本機Windows移植版本，可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔；包括對MSVC執行時間的擴展，以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

熱門話題

gmail信箱登陸入口在哪裡

7554

15

1382

52

steam的賬戶名稱是什麼格式

83

11

win11激活密鑰永久

59

19

NYT連接提示和答案

24

96