搜尋
首頁科技週邊人工智慧UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

最近,來自UCSD、IAIFI和MIT機構的研究人員,用一種全新的神經體積記憶架構(NVM),教會了一隻機器狗感知三維世界。

利用這項技術,機器狗可以透過單一的神經網路實現爬樓梯、跨縫隙、翻障礙等等——完全自主,無需遙控。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

不知道你有沒有註意到狗背上那個的白盒子?

裡面搭載的是蘋果的M1晶片,負責執行機器狗的視覺處理任務。而且,還是團隊從Mac上拆下來的。

不難看出,MIT的這隻機器狗可以輕鬆地爬過了橫在自己面前一段樹枝,毫不費力(基本上)。

長了4隻腳的MacBook?

眾所周知,對於機器狗,以及其他有腿的機器人來說,想要翻越不平整的道路,可謂是困難重重。

路面狀況越是複雜,就有越多的障礙物無法被看見。

為了解決「部分可觀測環境」問題,目前SOTA的視覺-運動技術透過框架堆疊(frame-stacking),將影像通道連接起來。

然而,這種簡單的處理方法遠遠落後於現在的電腦視覺技術——後者可以明確地模擬光流和特定的3D幾何形狀。

受此啟發,團隊提出了一種神經體積記憶架構(NVM),可以充分考慮到三維世界的SE(3)等變性(Equivalence)。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

計畫網址:https://rchalyang.github.io/NVM/

與以往的方法不同,NVM是一種體積格式。它可以將來自多個相機視圖的特徵體積聚合到機器人的自我中心框架中,讓機器人能更好地理解周圍的環境。

測試的結果顯示,使用神經體積記憶(NVM)對腿部運動進行訓練後,機器人在複雜的地形上的表現要明顯優於先前的技術。

此外,消融實驗的結果顯示,神經體積記憶中儲存的內容捕捉了足夠的幾何資訊來重構3D場景。

現實世界中的實驗

為了在模擬之外的不同現實世界場景中進行驗證,團隊在室內和室外場景中都進行了實驗。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

當機器狗發現有障礙物突然出現在自己面前時,直接就會選擇繞開。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

在滿是石頭的地面上,走起來好像也沒什麼問題,雖然比在平地上還是要費力一些的。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

相對於自身來說比較大的障礙,努努力還是可以翻過去的。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

採用先前的辨識控制技術,小狗後腿對距離判斷明顯出現了誤差,一腳踩溝裡翻車了,失敗。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

採用MIT提出的NVM之後,小狗過溝,穩穩的幸福,成功!

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

採用先前的辨識控制技術,小狗第一腳就踩空了,狗頭搶地,失敗。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

採用MIT提出的NVM之後,小狗四平穩地走過了矩陣。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

「腿部運動的體積記憶

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

# #使用以自我為中心的攝影機視角,本質上是一個處理「部分可觀測環境」的問題(Partially-Observed)。

為了使控制問題具體化,機器人需要從先前的幀中收集信息,並正確推斷被遮擋的地形。

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

在運動過程中,直接安裝在機器人底盤上的攝影機發生劇烈和突然的位置變化。

這樣,在表徵一連串的畫面的過程中,某單一影格能夠被放到正確的位置,就變得非常重要了。

為此,團隊提出的神經體積記憶(NVM)的概念,可以將輸入的一連串視覺訊息,轉化為場景特徵進行3D描繪,進而進行輸出。

透過自監督學習NVM

雖然「行為複製目標」足以產生一個好的策略,但針對平移和旋轉的等變性,自動為神經體積記憶提供了一個獨立的、自我監督的學習目標。

########################自監督學習:研究團隊訓練了一個獨立的解碼器。讓它透過一段視覺觀察和兩個影格之間的預估轉換,來預測不同影格中的視覺觀察。 ###############如上圖所示,可以假設在影格之間周圍的3D場景保持不變。由於相機是朝前看的,我們可以將先前幀的特徵體積規範化,並用它來預測後續的影像。 ############解碼器的視覺重建############第一幅圖顯示機器人在環境中移動,第二幅圖是輸入的視覺觀察結果,第三幅圖是使用3D特徵體積和預估畫面合成的視覺觀察效果。 ############對於輸入的視覺觀察,研究團隊對影像應用了大量的資料增強來提高模型的穩健性。 ######

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

#作者介紹

Ruihan Yan

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

Ruihan Yan是加州大學聖地牙哥分校的二年級博士生。在此之前,他於2019年在南開大學獲得軟體工程學士學位

他的研究興趣是強化學習、機器學習、機器人等。具體來說,他想建立智能體,利用來自不同來源的資訊進行決策。

Ge Yang

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

#Ge Yang本科畢業於耶魯大學物理和數學專業,並在芝加哥大學獲得物理學博士學位。目前是美國國家科學基金會人工智慧與基礎交互作用研究所(IAIFI)的博士後研究員。

Ge Yang的研究涉及兩組相關問題。第一組是透過重新檢視我們在神經網路中表徵知識的方式,以及知識如何在分佈中轉移,來改善學習。第二組是透過理論工具的觀點來看待強化學習,如神經正切核、非歐幾里德幾何和哈密頓動力學。

Xiaolong Wang

UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能

Xiaolong Wang是加州大學聖地牙哥分校ECE系的助理教授。他是TILOS國家科學基金會人工智慧研究所的機器人團隊的成員。

他在卡內基美隆大學獲得了機器人學的博士學位,並曾在加州大學柏克萊分校做博士後研究。

以上是UCSD、MIT等華人團隊教機器狗感知3D世界!搭M1晶片,爬樓跨障無所不能的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
Gemma範圍:Google'用於凝視AI的顯微鏡Gemma範圍:Google'用於凝視AI的顯微鏡Apr 17, 2025 am 11:55 AM

使用Gemma範圍探索語言模型的內部工作 了解AI語言模型的複雜性是一個重大挑戰。 Google發布的Gemma Scope是一種綜合工具包,為研究人員提供了一種強大的探索方式

誰是商業智能分析師以及如何成為一位?誰是商業智能分析師以及如何成為一位?Apr 17, 2025 am 11:44 AM

解鎖業務成功:成為商業智能分析師的指南 想像一下,將原始數據轉換為驅動組織增長的可行見解。 這是商業智能(BI)分析師的力量 - 在GU中的關鍵作用

如何在SQL中添加列? - 分析Vidhya如何在SQL中添加列? - 分析VidhyaApr 17, 2025 am 11:43 AM

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

業務分析師與數據分析師業務分析師與數據分析師Apr 17, 2025 am 11:38 AM

介紹 想像一個繁華的辦公室,兩名專業人員在一個關鍵項目中合作。 業務分析師專注於公司的目標,確定改進領域,並確保與市場趨勢保持戰略一致。 simu

什麼是Excel中的Count和Counta? - 分析Vidhya什麼是Excel中的Count和Counta? - 分析VidhyaApr 17, 2025 am 11:34 AM

Excel 數據計數與分析:COUNT 和 COUNTA 函數詳解 精確的數據計數和分析在 Excel 中至關重要,尤其是在處理大型數據集時。 Excel 提供了多種函數來實現此目的,其中 COUNT 和 COUNTA 函數是用於在不同條件下統計單元格數量的關鍵工具。雖然這兩個函數都用於計數單元格,但它們的設計目標卻針對不同的數據類型。讓我們深入了解 COUNT 和 COUNTA 函數的具體細節,突出它們獨特的特性和區別,並學習如何在數據分析中應用它們。 要點概述 理解 COUNT 和 COU

Chrome在這裡與AI:每天都有新事物!Chrome在這裡與AI:每天都有新事物!Apr 17, 2025 am 11:29 AM

Google Chrome的AI Revolution:個性化和高效的瀏覽體驗 人工智能(AI)正在迅速改變我們的日常生活,而Google Chrome正在領導網絡瀏覽領域的負責人。 本文探討了興奮

AI的人類方面:福祉和四人底線AI的人類方面:福祉和四人底線Apr 17, 2025 am 11:28 AM

重新構想影響:四倍的底線 長期以來,對話一直以狹義的AI影響來控制,主要集中在利潤的最低點上。但是,更全面的方法認識到BU的相互聯繫

您應該知道的5個改變遊戲規則的量子計算用例您應該知道的5個改變遊戲規則的量子計算用例Apr 17, 2025 am 11:24 AM

事情正穩步發展。投資投入量子服務提供商和初創企業表明,行業了解其意義。而且,越來越多的現實用例正在出現以證明其價值超出

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能