《科創板日報》9月25日訊(編輯 鄭遠方)當地時間24日,特斯拉機器人官方帳號Tesla Optimus更新了「具身智慧首秀」。
在介紹中,特斯拉稱,人形機器人Optimus(擎天柱)已可以自主對物品分類,其神經網路訓練是「完全端到端的」-即可實現視訊訊號輸入,控制訊號輸出。
在影片中,特斯拉機器人展示了視覺自標定、色彩分類任務、單腳保持平衡等能力,在感知、大腦、運動與控制方面具備多項亮點:
在感知方面,透過視覺感知及關節位置編碼器,Optimus可自動校準四肢,並精準定位四肢的空間位置。
在大腦方面,憑藉純視覺技術及完全本地部署的神經網絡,其可以迅速適應環境並完成多項任務。
其將藍色與綠色積木分別分類到對應顏色的托盤之中,即便在抓取積木過程中,有人在一旁將積木打亂,Optimus也可以立即調整並適應新環境,繼續分揀積木。同時,其還可以將翻倒的積木擺正,並執行「打亂分類好的積木」等新任務。
在動作控制能力方面,Optimus可以精準抓取物品,在做出動作時,機器人的四肢、軀幹、手指動作都極為靈活,且與人類接近。此外,Optimus也做出多個單腳支撐的運動伸展動作,並能在伸展的同時保持軀幹平衡。
值得注意的是,特斯拉端對端模型輸入端為視訊訊號,即影像及音訊訊號的混合輸入,但此次展示顯示,其辨識部分神經網路演算法僅使用視覺資訊。
中信證券認為,特斯拉V12自動駕駛的演算法體系同時應用於人形機器人及汽車是可行的,且有利於加速提升辨識演算法的泛化能力。隨著特斯拉展示了機器人端對端技術路線可能性,該方案與其FSD的運行模式類似,FSD以及Dojo的成功經驗有望加速機器人迭代速度,由單一任務向多任務拓展。
分環節來看,(1)在輸入端,分析師指出,本次特斯拉展現的影像識別,2D及3D相機都可實現,選配核心為成本控制因素,國內視覺鏡頭及相機等核心零件廠商已具備此類產品生產能力,產品配套方案及產品性價比值得關注。
(2)在輸出端,特斯拉人形機器人輸出端為訊號及姿態控制,關節、感測器、控制系統對輸出端穩定性至關重要,此領域可選方案較多,不同廠商可望在不同價格區間佔優勢。
(3)在演算法端,端對端框架能夠直接從原始輸入端到最終輸出端進行訓練,無需進行手動特徵工程或中間階段處理。儘管此影片未展示其具體演算法,但基於其輸入輸出訊息,建議專注於基於強化學習框架的機器人控制演算法。
(4)在硬體端,影片展現出特斯拉機器人的靜態運動控制穩定性及用以控制平衡的IMU的較高精度,且關節模組中的「雙編碼器」並非存在阻滯性較強的缺點,靈巧手中的編碼器也同樣具備較高精度。 IMU、編碼器等感測環節的重要性癒發顯現。
落實到具體標的上,浙商證券看好人形機器人產業化大趨勢,聚焦人形機器人核心零件製造龍頭。
電機:鳴志電器,關注匯川技術、江蘇雷利、步科股份、偉創電氣等;
絲槓:恆立液壓、長盛軸承、五洲新春,關注貝斯特、鼎智科技、日發精機、秦川機床等;
重寫內容:減速器品牌包括雙環傳動、綠的諧波、中大力德、上海機電、漢宇集團、豐立智能、大族激光、昊志機電等
感測器:華依科技、柯力感測、漢威科技、芯動聯科等;
可供選擇的控制器品牌包括華中數控、博眾精工、新時達、埃夫特、英威騰等
輕量化:精工科技、中復神鷹、吉林化纖、吉林碳谷等公司都在追求輕量化技術
整合:三花智控、拓普集團等;
機器人整機:艾斯頓、博實股、新松機器人等公司提供
特種機器人:晶品特裝。
重寫內容如下:
以上是特斯拉機器人全面進化!感知、大腦、運動控制能力升級 端對端方案初現成效的詳細內容。更多資訊請關注PHP中文網其他相關文章!

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

禪工作室 13.0.1
強大的PHP整合開發環境