搜尋
首頁科技週邊人工智慧華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

自2017年首次舉辦以來,CoRL已經成為了機器人學與機器學習交叉領域的全球頂級學術會議之一。 CoRL是機器人學習研究的單一主題會議,涵蓋了機器人學、機器學習和控制等多個主題,包括理論與應用

2023年的CoRL大會將於11月6日至9日在美國亞特蘭大舉行。根據官方數據透露,今年有來自25個國家的199篇論文入選CoRL。熱門主題包括操作、強化學習等。雖然相較於AAAI、CVPR等大型AI學術會議,CoRL的規模較小,但隨著今年大模型、具身智能、人形機器人等概念的熱度上升,值得關注的相關研究也會在CoRL會議上呈現

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

目前,CoRL 2023 官方已公佈最佳論文獎、最佳學生論文獎、最佳系統論文獎等獎項。接下來,我們將為大家介紹這些得獎論文。

最佳論文

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

  • #論文:Distilled Feature Fields Enable Few-Shot Language- Guided Manipulation
  • 作者:William Shen, Ge Yang, Alan Yu, Jensen Wong, Leslie Pack Kaelbling, Phillip Isola
  • 代理商:MIT CSAIL 、IAIFI
  • 論文網址:https://openreview.net/forum?id=Rb0nGIt_kh5

研究概述:目前,圖像模型中的自監督學習和語言監督學習已經融入了豐富的全球知識,這對於模型的泛化能力非常關鍵。然而,圖像特徵只包含了二維資訊。我們了解到,在機器人任務中,對於真實世界中三維物體的幾何形狀有所了解是非常重要的

透過使用蒸餾特徵場(Distilled Feature Field,DFF),該研究將精確的三維幾何圖形與來自二維基礎模型的豐富語義結合起來,以使機器人能夠利用二維基礎模型中豐富的視覺和語言先驗,從而完成基於語言指導的操作

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

具體來說,研究提出了一種用於6-DOF 抓取和放置的小樣本學習方法,並利用強大的空間和語義先驗泛化到未見過物體上。使用從視覺- 語言模型CLIP 中提取的特徵,該研究提出了一種透過開放性的自然語言指令對新物體進行操作,並展示了這種方法泛化到未見過的表達和新型物體的能力。

這篇論文的兩位共同一作是CSAIL 「具身智慧」團隊的成員William Shen 和楊歌,其中楊歌是2023 年CSAIL 具身智慧研討會的共同籌辦人。

我了解到《機器之心》曾經詳細介紹過這項研究,請查閱《大模型加持的機器人有多強,MIT CSAIL&IAIFI 用自然語言指導機器人抓取物體》

最佳學生論文

  • #論文:Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners
  • 作者:Allen Z. Ren, Anushri Dixit, Alexandra Bodrova, Sumeet Singh, Stephen Tu, Noah Brown, Peng Xu, Leila Takayama, Fei Xia, Jake Varley, Zhenjia Xu, Dorsa Sadigh, Andy Zeng, Anirudha Majumdar
  • 機構:普林斯頓大學、Google DeepMind
  • 論文地址:https://openreview.net/forum ?id=4ZK8ODNyFXx

大型語言模型(LLM)是一種具有廣泛應用前景的技術,在機器人領域尤其如此。然而,儘管LLM在逐步規劃和常識推理方面表現出了巨大的潛力,但它也存在一些幻覺問題

基於此,該研究提出了一種新框架—— KnowNo,用於度量和對齊基於LLM 的規劃器的不確定性。它能夠使 LLM 意識到哪些資訊是未知的,並在有需要時尋求協助。

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

KnowNo是基於共形預測理論的,它提供了任務完成的統計保證,並能夠最大程度地減少多步驟規劃任務中的人工幹預

該研究在各種模擬和真實機器人實驗中,以各種模式的不確定任務(包括空間不確定性、數位不確定性等等)對KnowNo 進行了測試。實驗結果表明, KnowNo 在提高效率和自主性方面表現出色,優於基線,且安全可信。 KnowNo 能夠在不進行模型微調的情況下直接用於 LLM,為模型的不確定性提供了一種有效的輕量級解決方法,並能夠與基礎模型不斷增強的能力相輔相成。

最佳系統論文

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

  • #論文:RoboCook: Long-Horizo​​n Elasto-Plastic Object Manipulation with Diverse Tools
  • 作者:Haochen Shi, Huazhe Xu, Samuel Clarke, Yunzhu Li, Jiajun Wu
  • 機構:史丹佛大學、 UIUC
  • 論文網址:https://openreview.net/forum?id=69y5fzvaAT

論文簡介:人類擅長製造和使用各種工具,但對於機器人而言,理解如何有效使用工具,並在相應的物體上完成操作仍然是一個很大的挑戰。該研究建構了一個名為RoboCook的智慧機器人系統,能夠透過各種工具感知、建模並操縱彈塑性物體(elasto-plastic object)

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

RoboCook 使用點雲場景表徵,利用圖神經網路(GNN)對工具與物體的相互作用進行建模,並將工具分類與自監督策略學習相結合,以製定操作計劃。

該研究表明,對於每個工具,僅需20 分鐘的現實世界互動數據,RoboCook 就能學會並操縱機械手臂完成一些複雜的、長時程的彈塑性物件操作任務,例如製作餃子、字母餅乾等。

根據實驗結果顯示,RoboCook 的性能明顯優於現有的SOTA 方法,且在面對嚴重的外部幹擾時仍能表現出穩定性,對不同材料的適應能力也更為出色

值得一提的是,這篇論文的共同一作分別是來自史丹佛大學的博士生Haochen Shi、原史丹佛大學博士後研究員、現清華大學交叉資訊科學研究所助理教授Huazhe Xu,論文作者之一為姚班校友、史丹佛大學助理教授吳佳俊。

華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈

獲獎論文入圍名單已經公佈

#

以上是華人團隊斬獲最佳論文、最佳系統論文獎項,CoRL研究成果獲獎公佈的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
讓我們跳舞:結構化運動以微調我們的人類神經網讓我們跳舞:結構化運動以微調我們的人類神經網Apr 27, 2025 am 11:09 AM

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

新的Google洩漏揭示了雙子AI的訂閱更改新的Google洩漏揭示了雙子AI的訂閱更改Apr 27, 2025 am 11:08 AM

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

數據分析加速度如何求解AI的隱藏瓶頸數據分析加速度如何求解AI的隱藏瓶頸Apr 27, 2025 am 11:07 AM

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

Markitdown MCP可以將任何文檔轉換為Markdowns!Markitdown MCP可以將任何文檔轉換為Markdowns!Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

如何使用Google ADK進行建築代理? - 分析Vidhya如何使用Google ADK進行建築代理? - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

在LLM上使用SLM進行有效解決問題-Analytics Vidhya在LLM上使用SLM進行有效解決問題-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

如何將Google Gemini模型用於計算機視覺任務? - 分析Vidhya如何將Google Gemini模型用於計算機視覺任務? - 分析VidhyaApr 27, 2025 am 09:26 AM

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Apr 27, 2025 am 09:20 AM

2025年的AI景觀正在充滿活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到來。 這些尖端的車型分開了幾週,具有可比的高級功能和令人印象深刻的基準分數。這個深入的比較

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具