搜尋
首頁科技週邊人工智慧特斯拉機器人全面進化!感知、大腦、運動控制能力升級 端對端方案初現成效

《科創板日報》9月25日訊(編輯 鄭遠方)當地時間24日,特斯拉機器人官方帳號Tesla Optimus更新了「具身智慧首秀」。

在介紹中,特斯拉稱,人形機器人Optimus(擎天柱)已可以自主對物品分類,其神經網路訓練是「完全端到端的」-即可實現視訊訊號輸入,控制訊號輸出

特斯拉机器人全面进化!感知、大脑、运动控制能力升级 端到端方案初现成效

在影片中,特斯拉機器人展示了視覺自標定、色彩分類任務、單腳保持平衡等能力,在感知、大腦、運動與控制方面具備多項亮點

在感知方面,透過視覺感知及關節位置編碼器,Optimus可自動校準四肢,並精準定位四肢的空間位置

在大腦方面,憑藉純視覺技術及完全本地部署的神經網絡,其可以迅速適應環境並完成多項任務

其將藍色與綠色積木分別分類到對應顏色的托盤之中,即便在抓取積木過程中,有人在一旁將積木打亂,Optimus也可以立即調整並適應新環境,繼續分揀積木。同時,其還可以將翻倒的積木擺正,並執行「打亂分類好的積木」等新任務。

在動作控制能力方面,Optimus可以精準抓取物品,在做出動作時,機器人的四肢、軀幹、手指動作都極為靈活,且與人類接近。此外,Optimus也做出多個單腳支撐的運動伸展動作,並能在伸展的同時保持軀幹平衡

特斯拉机器人全面进化!感知、大脑、运动控制能力升级 端到端方案初现成效

值得注意的是,特斯拉端對端模型輸入端為視訊訊號,即影像及音訊訊號的混合輸入,但此次展示顯示,其辨識部分神經網路演算法僅使用視覺資訊。

中信證券認為,特斯拉V12自動駕駛的演算法體系同時應用於人形機器人及汽車是可行的,且有利於加速提升辨識演算法的泛化能力。隨著特斯拉展示了機器人端對端技術路線可能性,該方案與其FSD的運行模式類似,FSD以及Dojo的成功經驗有望加速機器人迭代速度,由單一任務向多任務拓展。

分環節來看,(1)在輸入端,分析師指出,本次特斯拉展現的影像識別,2D及3D相機都可實現,選配核心為成本控制因素,國內視覺鏡頭及相機等核心零件廠商已具備此類產品生產能力,產品配套方案及產品性價比值得關注。

(2)在輸出端,特斯拉人形機器人輸出端為訊號及姿態控制,關節、感測器、控制系統對輸出端穩定性至關重要,此領域可選方案較多,不同廠商可望在不同價格區間佔優勢。

(3)在演算法端,端對端框架能夠直接從原始輸入端到最終輸出端進行訓練,無需進行手動特徵工程或中間階段處理。儘管此影片未展示其具體演算法,但基於其輸入輸出訊息,建議專注於基於強化學習框架的機器人控制演算法

(4)在硬體端,影片展現出特斯拉機器人的靜態運動控制穩定性及用以控制平衡的IMU的較高精度,且關節模組中的「雙編碼器」並非存在阻滯性較強的缺點,靈巧手中的編碼器也同樣具備較高精度。 IMU、編碼器等感測環節的重要性癒發顯現

落實到具體標的上,浙商證券看好人形機器人產業化大趨勢,聚焦人形機器人核心零件製造龍頭。

電機:鳴志電器,關注匯川技術、江蘇雷利、步科股份、偉創電氣等;

絲槓:恆立液壓、長盛軸承、五洲新春,關注貝斯特、鼎智科技、日發精機、秦川機床等;

重寫內容:減速器品牌包括雙環傳動、綠的諧波、中大力德、上海機電、漢宇集團、豐立智能、大族激光、昊志機電等

感測器:華依科技、柯力感測、漢威科技、芯動聯科等;

可供選擇的控制器品牌包括華中數控、博眾精工、新時達、埃夫特、英威騰等

輕量化:精工科技、中復神鷹、吉林化纖、吉林碳谷等公司都在追求輕量化技術

整合:三花智控、拓普集團等;

機器人整機:艾斯頓、博實股、新松機器人等公司提供

特種機器人:晶品特裝。

重寫內容如下:

以上是特斯拉機器人全面進化!感知、大腦、運動控制能力升級 端對端方案初現成效的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境