機器之能報道
編輯:吳昕
國內版的人形機器人 大模型組隊,首次完成疊衣服這類複雜柔性材料的操作任務。
隨著融合了 OpenAI 多模態大模型的 Figure 01 揭開神秘面紗, 國內同行的相關進展一直備受關注。
就在昨天,國內 " 人形機器人第一股 " 優必選發布了人形機器人 Walker S 深入融合百度文心大模型後的首個 Demo,展示了一些有趣的新功能。
現在,得到百度文心大模型能力加持的 Walker S 是這個樣子的。
和 Figure 01 一樣,Walker S 沒有走動,而是站在桌子後面完成一系列任務。它可以聽從人類的命令,折疊衣物。
完成任務後,你還可以和它聊天。例如問詢這件黑色上衣搭配什麼比較適合?機器人依然記得你要出差這件事,建議搭配深色褲子更適合正式場合。
它也會將桌上的各種開關歸置到盤子裡。
即使被幹擾,例如歸置好的開關又被丟回桌子上,或者眼看就要拿到手的插座又被移開了,Walker S 都能即時調整工作狀態,根據新情況完成歸置任務。
2 月,在新能源車廠訓練時 , Walker S 就已展現出多模態感知與運動控制能力。
此次,透過與文心大模型的深度融合,Walker S 的認知和操控能力再上台階,不僅獲得了高級意圖理解和細粒度任務規劃能力,更首次完成了疊衣服這類複雜柔性材料操作任務。
文心大模型系文心產業級知識增強大模型,具備跨模態、跨語言的深度語意理解與生成能力,還有知識推理、任務規劃等能力。透過將這些能力移植到人形機器人,可以讓機器人像人一樣對衣物的材質、形狀、褶皺等屬性進行分析和理解,並根據過往經驗推理出最佳的疊衣方式和順序。在實際疊衣過程中 , 機器人會即時分析衣物的狀態變化,並相應地調整自己的動作策略。
在物件幹擾分類任務中 , Walker S 也充分發揮了 "AI 大模型 機器人 " 的協同優勢。首先,透過端側的多模態感知模型獲取物體的空間定位和語義訊息,再將這些訊息交由大模型進行智慧處理,後者憑藉其出色的任務拆解和邏輯推理能力為Walker S 快速構建出最優的任務規劃和執行路徑。 Walker S 則將這套方案映射到機械手臂和靈巧手的實際操控中,最終流暢完成整套複雜任務。
此舉也是國內同行類似能力的首秀,其創新應用和實現難度在全球範圍內也屬於行業第一梯隊水平。 " 在許多展示中,包括 Figure 與 OpenAI 合作、我們與百度的合作,目前可以實現端到端。" 優必選管理層在昨晚的業績回顧與展望會上向第一財經記者表示。
" 我們利用了百度的大模型對任務的拆解、對自然語言的理解和順序邏輯排列等。除了公司去年基於開源模型訓練構建的基於端側的多模態大模型外,我們認為未來人形機器人市場競爭越來越激烈的情況下,強強聯合才能實現1 1>2。" 優必選管理層解釋這次合作時稱," 國外特斯拉有大模型能力,有OpenAI、英偉達與Figure 的結合等,可以看到合作能為人形機器人落地提供強大技術支撐。"
不過,透過對比OpenAI 的視頻,我們發現被賦能後的Walker S 仍然與Figure 01 存在差距。
最明顯的是動作速度。另外在指令內容上,Walker S 所接收的指令通常比較明確和具體,Figure 01 則能根據更抽象的指令,藉由常識推理將其轉化為合理可行的具體操作。
此外,Figure 01 能一邊工作一邊閒聊(尤其是解釋自己的操作),並具備短期記憶能力,可根據先前的對話內容來合理規劃當前的行動。
隨著生成式AI 競爭的日趨激烈,以及研究重點從長文本、多模態延伸到具身智能,我們有理由相信未來的人形機器人將不再局限於感知靜態數據,而是能夠在虛擬乃至真實的立體世界中自由行動、與環境互動。這也標誌著 AI 將實現從簡單的機器學習到複雜類人任務執行的重大跨越。
事實上,人形機器人賽道在過去半年已呈現出異常火熱的勢頭 , 國內外原型機頻頻亮相 , 新創公司融資活躍。 2 月優必選曝光 Walker S 在蔚來新能源汽車工廠試用的視頻,機器人可以流暢完成安全帶檢測、車標貼附等工作。優必選股價也曾在 3 月初兩天暴漲 200%。
不過,目前全球人形機器人仍處於試驗階段,規模化放量仍需時間。畢竟 ,demo 和實際應用的差異非常大,後者更要通盤考慮可靠性、穩定性、成本等一系列要素。優必選方面表示,AI 大模型與人形機器人的結合,將極大提升後者的智慧化程度和多場景任務適應能力,並加速其產業化進程。創辦人周劍也公開表示,希望今年年底完成第一批人形機器人在工廠的落地,透過測試並為 2025 年人形機器人形成批量爆發做準備。此外,今年底優必選計畫推出第一代家庭端情感陪護人形機器人,該機器人將搭載大模型,能與使用者互動並形成短期、長期記憶。
參考連結
https://www.stcn.com/article/detail/1164967.html
THE END
## 轉載請聯絡本公眾號授權投稿或尋求報告:content@jiqizhixin.com以上是2 個月不見,人形機器人 Walker S 會摺衣服了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

通常,机器人的主要功能是完成一些简单的操作任务,我们希望机器人可以模仿人,让能力尽可能接近人类水平。不论是小米的 CyberOne 还是特斯拉的 Optimus,人们关心的主要是其机械关节数量,控制算法和行走速度。不过在这个领域,有些人探索的方向更加脑洞大开:现在,有一种机器人把模仿真人表情做到了极致:先尝试一下自拍。从「嫌弃」到「惊讶」,都可以做到完全同步:这个机器人名叫 Ameca,是个表情怪。除了模仿,它自己也能照镜子做很多小表情,看起来非常像真人。Ameca「假装」第一次见到镜子,首

和活生生的已故历史名人聊天是个什么感觉?近日,就有一群开发者利用语言模型,把千百年来各行各业的历史名人全部「复活」成了聊天机器人,做进了一款手机app里,起名叫「你好,历史」!开发者声称,这个与古代名人聊天的app涉及的内容几乎无所不包。比如可以:与玛丽莲·梦露聊好莱坞八卦与弗里达·卡洛讨论现代艺术问问圣诞老人他有多少只驯鹿问问科特·科本为什么自杀向穴居人学习如何生火与宇宙意识辩论生命的意义不过他们也没忘记提醒用户,这些对话是由人工智能生成的,所以不要太认真。而且每个对话都是独一无二的,你永远不

大数据文摘出品作者:Caleb为庆祝英国女王伊丽莎白二世登基70周年,英国也是早早就洋溢出了庆典的味道。据了解,英国将于6月2日至5日连放4天公众假期,并在期间举行多项庆祝活动。英国皇家铸币厂也在精心打造有史以来最大的硬币,直径220毫米,重15公斤,面值15000英镑,耗时近400小时打造,是该厂1100年来生产的最大硬币。这枚金币一面雕刻着代表英国女王伊丽莎白二世的符号EⅡR,周围环绕着代表英国的玫瑰、水仙、蓟和三叶草。另一面有女王骑在马背上的图案。在这么热闹的日子里,AI当然也必须来凑一凑

人类与人工智能相比,哪个更擅长建立关系?事实上,这项革命性的技术已经存在了很长一段时间。然而,直到最近人们才意识到人工智能对人类的重要性。人工智能利用算法模拟人类,并随着时间的推移从经验中学习的能力,为这项技术与人类建立关系开辟道路。人类如何建立人际关系作为人类,我们倾向于只与少数人建立关系。我们试图确保不需要的和不相干的人从我们的生活中消失。在将我们的关系限制在少数人的同时,我们确保与那些对我们真正重要的人建立高质量的关系。然而,同样的方法在商业用语中可能不是理想的,并可能适得其反。尽管知道这

有抱负的工程师应该了解世界各地著名的机器人工程学院。现在是从事机器人和工程事业的最佳时机——从人工智能到太空探索,这一领域充满了令人兴奋的创新和进步。美国劳工统计局估计,未来10年,机械工程领域的职业总体上将保持7%的稳定增长率,确保毕业生将有大量的就业机会。机器人工程专业的学生平均工资超过9万美元,无需担心还助学贷款的问题。对于那些考虑投身机器人工程领域的人来说,选择一所合适的大学是非常重要的。世界上许多顶尖的机器人工程学院都在美国,尽管国外也有一些很棒的项目。这是7所世界上最好的机器人工程学

机器人也能干咖啡师的活了!比如让它把奶泡和咖啡搅拌均匀,效果是这样的:然后上点难度,做杯拿铁,再用搅拌棒做个图案,也是轻松拿下:这些是在已被ICLR 2023接收为Spotlight的一项研究基础上做到的,他们推出了提出流体操控新基准FluidLab以及多材料可微物理引擎FluidEngine。研究团队成员分别来自CMU、达特茅斯学院、哥伦比亚大学、MIT、MIT-IBM Watson AI Lab、马萨诸塞大学阿默斯特分校。在FluidLab的加持下,未来机器人处理更多复杂场景下的流体工作也都

还记得那个和特斯拉飙车的机器人吗?这是瑞士苏黎世联邦理工学院衍生公司研发的与公司同名的四足轮腿式机器人——Swiss-Mile,前身是ANYmal四足机器人。距离它和特斯拉飙车还不到半年的时间,它又实现了重大升级。这次升级改进了机器人的算法,运动能力直接UP UP UP ! 可以双腿站立下楼梯:(小编内心OS:如果是我穿轮滑鞋下楼梯可能会摔个狗吃屎)楼梯爬累了,坐个电梯吧,用前脚按开电梯门:面对障碍物应对自如:它还能知道什么时候该站起来,什么时候该“趴下”,双腿直立与四足运动之间的切换更丝滑:

日前,美国西北大学工程师开发出有史以来最小的遥控步行机器人,它以一种小巧可爱的螃蟹形式出现。这种微小的“螃蟹”机器人宽度只有半毫米,可以弯曲、扭曲、爬行、行走、转弯甚至跳跃,无需液压或电力。IT之家了解到,相关研究成果发表在《科学・机器人》上。据介绍,这种机器人是用形状记忆合金材料所制造的,然后可以变成所需的形状,当你加热后又会变回原来的形状,而热量消失时可以再次弹回变形时的样子。据介绍,其热量是由激光所带来的。激光通过“螃蟹”加热合金,但因为它们非常小,所以热量传播非常快,这使得它们的响应速度


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),