12月27日,MetaAI 負責視覺和強化學習領域的A
#截止27日晚間,這篇推文的閱讀量已經達到73.9k。
他表示,僅給出5個演示,MoDem就能在100K交互步驟中解決具有稀疏獎勵和高維動作空間的具有具有挑戰性的視覺運動控制任務,大大優於現有的最先進方法。
有多優秀呢?
他們發現MoDem在完成稀疏獎勵任務方面的成功率比低資料機制中的先前方法高出150%-250%。
Lecun也轉發了這項研究,表示MoDem的模型架構類似於JEPA,可在表徵空間做出預測且無需解碼器。
連結小編就放在下面啦,有興趣的夥伴可以看看~
論文連結:https://arxiv.org/abs/2212.05698
Github連結:https: //github.com/facebookresearch/modem
研究創新與模型架構
樣本效率低是實際應用部署深度強化學習(RL) 演算法的主要挑戰,尤其是視覺運動控制。
基於模型的RL有可能透過同時學習世界模型並使用合成部署來進行規劃和政策改進,從而實現高樣本效率。
然而在實踐中,基於模型的RL的樣本高效學習受到探索挑戰的瓶頸,這次研究恰恰解決了這些主要挑戰。
首先,MoDem分別透過使用世界模型、模仿RL和自監督視覺預訓練,解決了視覺強化學習/控制領域的三個主要挑戰:
- 大樣本複雜性(Large sample complexity)
- 高維狀態與動作空間探索(Exploration in high-dimensional state and action space)
- 同步視覺表徵與行為學習(Simultaneous learning of visual representations and behaviors)
這次的模型架構類似Yann LeCun的JEPA,且無需解碼器。
作者Aravind Rajeswaran表示,相較於Dreamer需要像素級預測的解碼器,架構繁重,無解碼器架構可支援直接插入使用SSL預訓練的視覺表示。
此外基於IL RL,他們提出了一個三階段演算法:
#- BC預訓練策略
- 使用包含演示和探索的種子資料集預先訓練世界模型,此階段對於整體穩定性和效率很重要
- 透過線上互動微調世界模型
#結果顯示,產生的演算法在21個硬視覺運動控制任務中取得了SOTA結果(State-Of-The-Art result),包括Adroit靈巧操作、MetaWorld和DeepMind控制套件。
從數據來看,MoDem在各項任務中的表現遠優於其他模型,結果比之前的SOTA方法提升了150%到250%。
紅色線條為MoDem在各項任務中的表現
在這個過程中,他們也闡明了MoDem中不同階段的重要性、資料增強對視覺MBRL的重要性以及預訓練視覺表示的實用性。
最後,使用凍結的 R3M 功能遠遠優於直接的 E2E 方法。這很令人興奮,表明影片中的視覺預訓練可以支持世界模型。
但8月資料強勁的E2E與凍結的R3M競爭,我們可以透過預訓練做得更好。
以上是Meta推出MoDem世界模型:解決視覺領域三大挑戰,LeCun轉發的詳細內容。更多資訊請關注PHP中文網其他相關文章!

利用“設備” AI的力量:建立個人聊天機器人CLI 在最近的過去,個人AI助手的概念似乎是科幻小說。 想像一下科技愛好者亞歷克斯(Alex)夢見一個聰明的本地AI同伴 - 不依賴

他們的首屆AI4MH發射於2025年4月15日舉行,著名的精神科醫生兼神經科學家湯姆·因斯爾(Tom Insel)博士曾擔任開幕式演講者。 Insel博士因其在心理健康研究和技術方面的傑出工作而聞名

恩格伯特說:“我們要確保WNBA仍然是每個人,球員,粉絲和公司合作夥伴,感到安全,重視和授權的空間。” anno

介紹 Python擅長使用編程語言,尤其是在數據科學和生成AI中。 在處理大型數據集時,有效的數據操作(存儲,管理和訪問)至關重要。 我們以前涵蓋了數字和ST

潛水之前,一個重要的警告:AI性能是非確定性的,並且特定於高度用法。簡而言之,您的里程可能會有所不同。不要將此文章(或任何其他)文章作為最後一句話 - 目的是在您自己的情況下測試這些模型

建立杰出的AI/ML投資組合:初學者和專業人士指南 創建引人注目的投資組合對於確保在人工智能(AI)和機器學習(ML)中的角色至關重要。 本指南為建立投資組合提供了建議

結果?倦怠,效率低下以及檢測和作用之間的差距擴大。這一切都不應該令任何從事網絡安全工作的人感到震驚。 不過,代理AI的承諾已成為一個潛在的轉折點。這個新課

直接影響與長期夥伴關係? 兩週前,Openai提出了強大的短期優惠,在2025年5月底之前授予美國和加拿大大學生免費訪問Chatgpt Plus。此工具包括GPT-4O,A A A A A


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

WebStorm Mac版
好用的JavaScript開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)