搜尋
首頁科技週邊人工智慧生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

基於網路資料訓練的生成模型徹底改變了文字、圖像和影片內容的創建方式。有研究者預測,也許生成模型的下一個里程碑是能夠模擬人類體驗世界的各個層面,例如在公路上如何駕駛汽車,又例如如何準備餐點。

現今,借助非常全面的真實世界模擬器(real-world simulator),人類可以與不同場景和物體進行交互,機器人也可以從模擬經驗中進行學習,從而避免物理損壞的風險。

然而,建構這樣一個真實世界模擬器的主要障礙之一在於可用的資料集。儘管網路上有數十億的文字、圖像和影片片段,但不同的資料集涵蓋不同的資訊軸,必須將這些資料集整合在一起才能模擬出對世界的真實體驗。例如,成對的文字影像資料包含豐富的場景和對象,但很少有動作;視訊字幕和問答資料包含豐富的高級活動描述,但很少有低階運動細節;人類活動資料包含豐富的人類動作,但很少有機械運動;而機器人數據包含豐富的機器人動作,但數量有限

以上列舉的信息差異是自然的且難以克服,這給構建一個旨在捕捉現實世界真實體驗的真實世界模擬器帶來了困難。

本文中,來自UC 柏克萊、Google DeepMind、MIT 等機構的研究者探索了透過產生模型學習真實世界互動的通用模擬器UniSim,邁出了建立通用模擬器的第一步。例如 UniSim 可以透過模擬「打開抽屜」等高階指令和低階指令的視覺結果來模擬人類和智慧體如何與世界互動。

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

  • #論文網址:https://arxiv.org/pdf/2310.06114.pdf
  • 論文首頁:https://universal-simulator.github.io/unisim/

本文將大量數據(包括互聯網文本- 圖像對,來自導航、人類活動、機器人動作等的豐富數據,以及來自模擬和渲染的數據)結合到一個條件視頻生成框架中。然後透過仔細編排沿著不同軸的豐富數據,本文表明 UniSim 可以成功地合併不同軸數據的經驗並泛化到數據之外,透過對靜態場景和物件的細粒度運動控制來實現豐富的互動。

下面影片示範了UniSim 如何模擬具有長互動視界的範例,影片顯示UniSim 一口氣模擬了機器人八個動作指令:

UniSim 對人類動作的模擬:

UniSim 對RL 策略的模擬部署如下所示:

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

##Meta首席AI科學家Yann LeCun和英偉達高級研究科學家Jim Fan等行業專家對這項研究進行了轉發。 LeCun對此給出了一個「酷」的評價

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

Jim Fan表示,這項工作非常有趣。視訊擴散模型被用作數據驅動的物理模擬,其中智能體可以規劃、探索和學習最優行動,而無需接觸機器人硬體或造成任何損害。可以說,LLM不僅是一個作業系統,也是一個完整的現實模擬器

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

#論文的第一作者,加州大學柏克萊分校的博士生Sherry Yang表示,「學習現實世界模型正在成為現實。」

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

模擬現實世界的互動

根據圖3所示,UniSim可以模擬廚房場景中的一系列豐富動作,包括洗手、拿碗、切胡蘿蔔和擦乾手。圖3右上方顯示了不同的開關,而圖3底部則展示了兩個導航場景

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

#需要改寫的內容是:對應於圖3右下方的導航場景

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

對應上圖3右下的導航場景

以下圖4 展示了一個UniSim 自回歸地順序模擬8 個互動的例子,在長程模擬方面

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

UniSim不僅支援豐富的動作和長程交互,也能夠實現高度多樣化和隨機的環境變換。例如,在移除頂部的毛巾後,顯示的物件具有多樣性(見下圖5左)

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

#UniSim 在真實世界遷移的結果。 UniSim 的真正價值在於模擬現實世界,圖 7 顯示了 VLM 生成的語言規劃,UniSim 根據語言規劃生成的視頻,以及在真實機器人上的執行情況。

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

除了測試UniSim 在真實世界的遷移能力之外,本文也進行了基於模擬器的評估,結果如表2 所示:

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

用於強化學習的真實世界模擬器

實驗也評估了UniSim 在模擬真實機器人執行各種動作方面的品質如何,機器人透過重複執行低階控制操作約20-30 個步驟來左、右、下、上移動端點。表 3 顯示,RL 訓練顯著提高了 VLA 策略在各種任務中的效能,尤其是在指向藍色區塊等任務中。然後,本文直接將在 UniSim 中訓練的 RL 策略零樣本部署到真實機器人上,如圖 8(底行)所示。

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

生成模型建立互動式現實世界模擬器,LeCun覺得非常酷

#

以上是生成模型建立互動式現實世界模擬器,LeCun覺得非常酷的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
如何使用Huggingface Smollm建立個人AI助手如何使用Huggingface Smollm建立個人AI助手Apr 18, 2025 am 11:52 AM

利用“設備” AI的力量:建立個人聊天機器人CLI 在最近的過去,個人AI助手的概念似乎是科幻小說。 想像一下科技愛好者亞歷克斯(Alex)夢見一個聰明的本地AI同伴 - 不依賴

通過斯坦福大學激動人心的新計劃,精神健康的AI專心分析通過斯坦福大學激動人心的新計劃,精神健康的AI專心分析Apr 18, 2025 am 11:49 AM

他們的首屆AI4MH發射於2025年4月15日舉行,著名的精神科醫生兼神經科學家湯姆·因斯爾(Tom Insel)博士曾擔任開幕式演講者。 Insel博士因其在心理健康研究和技術方面的傑出工作而聞名

2025年WNBA選秀課程進入聯盟成長並與在線騷擾作鬥爭2025年WNBA選秀課程進入聯盟成長並與在線騷擾作鬥爭Apr 18, 2025 am 11:44 AM

恩格伯特說:“我們要確保WNBA仍然是每個人,球員,粉絲和公司合作夥伴,感到安全,重視和授權的空間。” anno

Python內置數據結構的綜合指南 - 分析VidhyaPython內置數據結構的綜合指南 - 分析VidhyaApr 18, 2025 am 11:43 AM

介紹 Python擅長使用編程語言,尤其是在數據科學和生成AI中。 在處理大型數據集時,有效的數據操作(存儲,管理和訪問)至關重要。 我們以前涵蓋了數字和ST

與替代方案相比,Openai新型號的第一印象與替代方案相比,Openai新型號的第一印象Apr 18, 2025 am 11:41 AM

潛水之前,一個重要的警告:AI性能是非確定性的,並且特定於高度用法。簡而言之,您的里程可能會有所不同。不要將此文章(或任何其他)文章作為最後一句話 - 目的是在您自己的情況下測試這些模型

AI投資組合|如何為AI職業建立投資組合?AI投資組合|如何為AI職業建立投資組合?Apr 18, 2025 am 11:40 AM

建立杰出的AI/ML投資組合:初學者和專業人士指南 創建引人注目的投資組合對於確保在人工智能(AI)和機器學習(ML)中的角色至關重要。 本指南為建立投資組合提供了建議

代理AI對安全操作可能意味著什麼代理AI對安全操作可能意味著什麼Apr 18, 2025 am 11:36 AM

結果?倦怠,效率低下以及檢測和作用之間的差距擴大。這一切都不應該令任何從事網絡安全工作的人感到震驚。 不過,代理AI的承諾已成為一個潛在的轉折點。這個新課

Google與Openai:AI為學生打架Google與Openai:AI為學生打架Apr 18, 2025 am 11:31 AM

直接影響與長期夥伴關係? 兩週前,Openai提出了強大的短期優惠,在2025年5月底之前授予美國和加拿大大學生免費訪問Chatgpt Plus。此工具包括GPT-4O,A A A A A

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。