首頁  >  文章  >  科技週邊  >  00後CEO楊豐瑜:耶魯博士回國創業,五個月造出首款「可量產」人形機器人|AI Pioneer

00後CEO楊豐瑜:耶魯博士回國創業,五個月造出首款「可量產」人形機器人|AI Pioneer

PHPz
PHPz原創
2024-08-06 01:57:02795瀏覽

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

人類正在迎來人工智慧領域的爆炸性更新,技術向未知拓展的每一步,幾乎都引起驚人的關注度。

在人工智慧邊界擴張的過程中,重要賽道的技術路線創新與分歧並存。技術先鋒者的判斷與選擇,影響著眾多跟隨者的腳步。

過去一年,本站獨家率先將月之暗面、生數科技、愛詩科技、無問芯穹等優秀公司介紹給大家,為他們在互聯網世界留下了第一份「萬字訪談底稿」。在科技路線尚未收斂的階段,我們看到了到真正擁有信念、勇氣以及系統化認知的 AI 創業家的引領力量。

因此,我們推出「AI Pioneers」 的專欄,希望繼續尋找和紀錄AGI 時代人工智慧各細分賽道具有領袖氣質的創業者,介紹AI 賽道最出眾、高潛的創業公司,分享他們在AI 領域最前沿、鮮明的認知。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

作者:姜菁玲

本站報道

即使年輕的學術天才已成為當下AGI公司創始人的主要背景之一,2000年時,2000年。 。

本科密西根大學計算機專業,耶魯大學計算機專業博士生,年僅23歲的楊豐瑜,在去年開始了自己的具身智能機器人事業。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

2024年,由他創辦的UniX AI具身智慧公司,在五個月內完成了一款輪式人形機器人的研發製造,這款帶有「餐後清潔」以及「洗衣服」等功能的機器人將於九月開始量產,對外銷售。
00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer
在許多具身智慧機器人仍然停留在實驗室的階段,這是一個很快的商業化速度。 在蘇州,UniX AI公司的機器人量產工廠已經超過兩千五百平。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

這家在去年幾乎沒人聽說過的公司,在大半年內網羅了多位機器人產業內的資深技術人才。 「有頭部服務機器人的研發總監幫我們做底盤,也有一些頭部的人形機器人公司頂尖人才在負責我們的硬體」。 2024年7月,上海交大著名機器人專家王賀升教授,宣布正式加入UniX AI擔任首席科學家。

在UniX AI釋放出的首支技術展示影片中,名為Wanda的輪式人形機器人能夠完成抓起豆腐、協助分類衣物、將衣物拿到洗衣機清洗等任務。當下具身智慧公司難以解決的「柔性任務」問題,UniX AI似乎找到解決方案。 00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer
「我不覺得年輕有什麼不好,從技術層面來講,當下很多新技術、新產品,很多是由擁有深厚學術背景的年輕人創造的」,令我們有些意外的是,作為00後,楊豐瑜本人在談吐中表現出超越年齡的成熟,對於公司管理和具身智能的技術階段擁有非常清晰的認知。

我們對UniX AI的好奇集中在,一個在創投圈幾乎沒有任何消息的具身智能公司,為何能做到如此快的發展速度;作為極少的由00後操刀建立的具身智慧公司,UniX AI如何實現從0到1的發展? UniX AI的具身智慧終局路線圖又是什麼樣的呢?

帶著這些問題,本站與楊豐瑜展開了他創業以來的第一次公開媒體對話。

耶魯00後    投身俱身智能創業  

本站:你現在已經畢業了本站嗎?

楊豐瑜:我是本科直博到的耶魯,博士畢業的論文要求我基本都達到了,就拿今年來說吧,我中了4篇CVPR,加上其他,總共有十多篇人工智慧和機器人的頂會文章。

本站:你的精力很旺盛。

楊豐瑜:(笑),常常熬夜到凌晨三點半,前段時間還去打吊針。主要是因為團隊在一起,常常不看手錶,一抬頭就已經很晚了。

本站:是什麼時候開始想到要創業的?

楊豐瑜:我一直認為創業是「天時地利人和」。

去年我們看到感知層面在技術上有很大進步,包括視覺、語言模型和觸覺等多模態的一些大模型或基座模型都有了很大的發展,這讓我們看到了實現目標的可能性。另外國家也有一系列的支持政策推出,為創業提供了一個良好環境。 這是「天時」。

「地利」:毋庸置疑,通用人形機器人是繼新能源汽車之後的下一個發展方向,中國在供應鏈方面有著無可比擬的優勢,而且長三角這邊的高科技人才也非常多。
00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer
一開始,我們做了一些調查,去弄清楚目前機器人行業的工程化水平進展到哪個階段、市場需求在哪裡、上一代機器人解決了哪些問題以及它未來的機會在哪裡?

能夠成事,關鍵還是找到對的人。今年,我們正式組建團隊,快速集結了許多方面的專家,有頭部掃地機器人的研發總監,也有一些頭部人形機器人公司頂尖人才,負責我們的硬體。在演算法層面,我在美國以及歐洲招募了一批人才,包括我的一些同學、師兄,這是「人和」。

作為創始人和CEO,最重要的是集合資源。 UniX AI是一個全球化的公司,把全世界不同國家在機器人軟體、硬體、供應鏈的優勢結合起來;同時我們有國際化的規劃,透過一年、三年、五年計畫的持續努力,實現Robots For All的公司願景。

本站:簡單介紹一下你的學術經驗吧

楊豐瑜:小學到高中是在國內,本科去密西根大學讀了計算機專業。一開始接觸的是視覺和機器學習,後來在導師「多模態學習」的影響下,開始進行視觸覺的研究。

本科期間發表了5篇機器人視觸覺論文,其中「Touch and Go: Learning from Human-Collected Vision and Touch」是世界上現今最大的視觸覺感測資料集,人工智慧和機器學習領域的頂級會議NuerIPS接收。

在另外一個工作裡,我們第一次引入diffusion model完成了對視覺和觸覺之間的相互轉化,成果被ICCV接收。

對機器人來說,觸覺很重要。一件衣服,是聚酯纖維、棉紡還是絲,靠肉眼不太能觀察得出,只有真正摸上去,才能分辨不一樣的質地。另外在一些精細活動上,例如將充電線插入充電口,也需要透過觸覺不斷調整,單靠視覺無法完成。

本站:然後你就來到了耶魯。

楊豐瑜:因為在機器人視觸覺方面的一些工作,特別是視觸覺的轉化和在大語言模型中的泛化運用,我獲得了北美計算機協會傑出本科科學家稱號,是學校有史以來第一人。最後選擇耶魯大學進行博士深造。

在這段期間,我陸續發表了一些論文,其中《Binding touch to everything: Learning unified multimodal tactile representations》(CVPR, 2024, pp.26340-26353),在這篇論文中,我提出了世界首個適用於多款不同觸覺感測器的觸覺大模型UniTouch,適用於與視覺、語言和聲音等多種模態相連的基於視覺的觸覺感測器。

另外一篇論文《Tactile-Augmented Radiance Fields》(CVPR, 2024, pp.26529-26539),則建立了世界上第一個可以在場景級泛化的3D視觸覺模型, UniX AI人形機器人的泛化能力也是基於此模型。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

本站:你覺得00後的身份對你來講是更有利還是更有弊?

楊豐瑜:創業公司,創辦人是靈魂。 很多人會覺得我很年輕,但我覺得00後的身份不是問題。

從技術層面講,在迎接這一輪的科技變革和賽道創新的浪潮中,年輕人具有非常強的推動作用。 很多新技術、新產品是由當下的年輕人創造的,特別是高科技產業,進入門檻相對較高。 Sora核心團隊的成員之一也是我同學,他在密西根大學時就展現出了很強的技術能力。

從認知和經驗層面講,我覺得快速學習、快速糾錯也是一種路徑。另外是個性,要肯堅持有韌性,想盡一切辦法,有「逢山開路,遇水搭橋」的精神,畢竟創業最後都是拿結果說話。

當然,UniX AI團隊中也有很多有經驗的專家,他們在結構、電子等方面有豐富的經驗,我們之間有效配合,才能在短時間內推出我們的產品。

視觸覺+操作  提升機器人可泛化能力  

本站:觸覺的提升為何對機器人

本站:觸覺的提升為何對機器人是重要的?

楊豐瑜:人是一個多感官動物,你的行動決策通常是多個感官共同傳遞過來的信息綜合影響,智能機器人理論上也是這樣。

觸覺是最重要的感官訊息之一,跟視覺回饋相比,它產生在機器人與環境互動之後,而視覺回饋是在之前。
當機器人抓取一個物體時,物體發生了形變,本質上,這個互動動作發生後,機器人獲得的增量資訊都來自於觸覺——它摸起來是怎樣的。
擁有觸覺訊息能夠讓機器人在一些更複雜更細膩的任務上表現得更好,大大提高抓取任務的成功率,
尤其是在柔性物體的抓取中,觸覺的作用更加明顯,可以說是從基本不可能完成任務到能夠完成任務的質的提升。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

比如,我們的輪式人形機器人Wanda已經實現捏雞蛋、抓豆腐、洗衣服等任務,純靠視覺去做,機器人得不到反饋,是很難執行下來的。 🎜🎜🎜🎜
為什麼現在機器人主要依靠視覺做判斷,是因為視覺方面的資料相較於其他,是最直接、容易取得且被訓練起來的,有大量資料可以用。但是在機器人往具身方向更進一步去走的時候,光靠視覺是肯定不夠的。

作為一種依賴互動產生的感官訊息,能夠將觸覺訊息合理運用的意義還在於,機器人能夠逐步在與世界的真實互動中不斷學習,變得更加可用和泛化。

本站:為什麼加入觸覺後,機器人對柔性物體的控制水平會提升,原理是什麼?

楊豐瑜:原理主要在於柔性物體與剛性物體在抓取和操作時有很大的不同。剛性物體在觸碰前後,其物理形狀基本上不會改變,因此透過視覺觀察,在抓取時相對容易判斷。然而,柔性物體在抓取之前或操作之前,透過觀察很難確定與它接觸後會發生什麼情況,因為在抓取過程中會出現大量的遮擋和形變,而這些形變通過視覺是很難準確預測的。

例如,當拿一張紙巾時,一旦將紙巾握到手裡面,就會完全遮擋住視線,此時視覺幾乎無法提供有效的信息來判斷如何抓取或操作。在這種情況下,就只能依靠觸覺等物理資訊來完成感知。

本站:為什麼好像很多時候我也不需要去嘗試抓一下物體,我就知道怎麼抓。

楊豐瑜:那是因為你作為一個人類來說,已經融合得很好了,以至於你不知道你用了觸覺信息在這裡面。你已經累積了二十多年的觸覺數據,所以你不知道是哪一種感官支持你讓你去完成了這個任務。

本站:對大部分機器人任務來說,不同感官的貢獻比會有什麼差別?現階段,觸覺的優先順序有多高?

楊豐瑜:對於大部分機器人的任務來說,不同感官在感知、推理決策和行動這三個步驟中的貢獻比例有所不同。

在感知層面上,初期主要依靠視覺和點雲來獲取全局信息,比如知道整個家的佈局、水在哪裡等。目前,透過視覺大模型和3D大模型來感知全局資訊的問題已基本解決。

在決策層面上,主要依靠語言引入人類的先驗知識。 例如,機器人接到從冰箱拿水的指令後,能進行任務拆解,知道第一步打開冰箱,第二步拿水,第三步關冰箱,這些先驗知識來自大量的互聯網數據。

在行動層面上,視覺可以幫助機器人確定抓取的位置,但在確定抓取力度等方面,觸覺訊息起著重要作用。例如在有遮蔽的情況下,像拿豆腐時,視覺難以準確判斷抓取方式,而觸覺能提供關鍵訊息,幫助機器人完成精確抓取。

此外,觸覺在一些精細力控的場景,如捏雞蛋、抓豆腐等,以及在一些需要判斷物體形變和力的反饋的場景中,發揮著重要作用。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

總的來說,不同感官的貢獻比因任務而異,在一些剛性物體的抓取中,視覺可能佔比較高;而在許多柔性物體的抓取中,觸覺的作用更為關鍵,甚至可以說是從基本無法完成任務到能夠完成任務的質的提升。

本站:觸覺這塊有夠高的壁壘嗎?落地到機器人產品裡有什麼困難?

楊豐瑜:我認為相對來說是比較高的,在2023年之前,觸覺一直是一個非常小眾的模態,與視覺和聽覺相比,從事觸覺相關工作的人非常少。

在進行觸覺相關工作的初期,感測器是最大的難題。當時,全世界從事數據相關工作的人並不多,如何製作感測器是一個關鍵問題。

其次,是如何解析觸覺資訊的問題,這涉及到演算法和資料兩個層面。 資料層面,先前世界上絕大多數觸覺感測的具體數據並不公開,這可能是由於許多機器人結合的特殊性或其他原因導致,使得機器人領域的數據公開程度不如視覺領域。因此,我們不斷解決資料集的問題,致力於推動全世界觸覺感測資料集的持續公開。

在演算法層面,觸覺與視覺存在差異,其中包含許多物理的先驗知識。 例如,透過感測器上的marker可以判斷受力情況,但這些資訊不像視覺訊息那樣易於解釋和辨識。

當時還進行過一個實驗,結果顯示產生的觸覺訊號讓人分辨起來非常困難。因為如果人沒有經過一些特定的訓練,很難分辨出每一種東西的觸覺感測訊號。我們也積極努力降低這一壁壘,推動學術界更多的人參與其中,以促進整個觸覺域的發展與進步。
00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer
本站:如果說,觸覺資訊不僅面臨現存資料量少的問題,大規模採集成本也很高,那怎麼去做到Scale up?

楊豐瑜:我們之前做的工作其實就是嘗試解決這個問題,如何在大規模採集難以實現的情況下做到Scale up:

第一步,我們把視覺和觸覺第一步,我們把視覺和觸覺打通,透過視覺來預測觸覺,甚至在沒有觸覺採集的場景中,利用視覺和語言等資訊來推測觸覺訊號。

例如,採集了同類型同材料的桌子的觸覺信息後,到新的家庭或辦公室場景中,即使沒有實際觸摸過過新的桌子,也能通過視覺和語言信息推測其觸覺信號。這樣的話,我們可以做到即使沒有真正物理性的接觸,也能夠擴大可用資料集。但是這種方式可能跟真實訊號有些出入,因為這是預測的。

第二,我們不斷推動觸覺資料集的公開。 透過公開資料集,可以讓更多人參與觸覺領域的研究和發展中,從而促進整個領域的進步。

第三,在演算法層面上,我們努力降低觸覺訊息辨識的門檻。 例如,透過在感測器上添加標記(marker),並發現標記在受到不同力時的變化規律,從而利用這些物理的先驗知識來更好地解析觸覺資訊。

第四,致力於將不同的訊息,如視覺、觸覺、語言等多模態訊息結合在一起,以完成各種任務。 透過多模態訊息的融合,可以在一定程度上彌補觸覺資料量少的不足,提高模型的泛化能力和適應性。

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

本站:大規模採集是否可以實現,需要什麼條件?

楊豐瑜:我認為這其實是整個具身智能發展的瓶頸,我個人認為可以實現大規模採集,但這裡有一個商業化的過程。

當機器人走進千家萬戶,有一定量的時候,你就能收集到足夠多的數據,支持更多的場景來做一些泛化。當然你不可能永遠採到每一個點,所以「大規模」這個命題會一直存在。那機器學習的本質就是透過稀疏的取樣,實現稠密分佈的一個模擬擬合和預測。

在數據這方面,我們並不排斥模擬,但我覺得一定量的真機數據是實現具身智能的必要條件。

本站:觸覺大模型有哪些關鍵的技術指標?

楊豐瑜:觸覺大模型跟任何大模型一樣,在不同的下游任務裡面都有一些指標。我帶領團隊建構的世界上現存最大的視觸覺資料集Touch and go,是全世界機器人視觸覺預訓練模型重要通用基準之一。

具身智慧機器人Wanda  九月開始量產  

本站:決定創業之後,打算做一個怎樣的具身智能公司?

楊豐瑜:創業的本質是為社會創造價值。 UniX AI是全球少數幾家把C端定為第一戰略的具身智慧機器人公司。

TO C雖然有很長的一段路要走,但背後的潛力是巨大的。從產業層面講,人形機器人已經進入硬體+AI的技術融合期,發展飛速,越來越具備實用性。而且我樂觀估計,這個融合進程要比原先業內人士預估的快很多。

人口老化,出生率低下,勞動力短缺…這些都是全世界面臨的問題。企業的責任是要為社會解決問題,這是UniX AI的機會點和價值點,也是我創業的初心。現在這個賽道大致的落地路徑基本上是工業——商業——家庭,我們會覆蓋商業和家庭,這也是服務TO C用戶的主要場景。

UniX AI的願景是Robots For All,打造通用的人形機器人,在運動能力與智慧程度方面都做到領先,實現體力勞動和智能陪伴。

本站:為什麼一開始選擇家庭場景去做?

楊豐瑜:事實上我們不只局限於家庭場景,我們也做泛商業的場景,例如辦公室等。

To B 場景從技術上來說相對難度低一些,重複率高,對泛化性要求沒有那麼高。但To B的場景往往是強替代邏輯,這就對機器人的速度、操作準確率要求會非常高。

家庭場景很複雜,千變萬化,每個家都是一個小生態,要求機器人具備很強的泛化能力。這當然對我們的產品提出了更高的要求。同時,我們在家庭場景中也會有許多L2等級的功能,更提升了產品在複雜場景的適應性和可玩性。

總的來說,我們的技術堆疊無論是 To B 還是 To C,都能涵蓋。做好了家庭場景,我覺得其他場景都能游刃有餘。從最難的骨頭開始啃咬,一方面體現了UniX AI的技術實力,一方面也是我們切入市場的戰略路徑。

This site: Do you also do To B scenes like factories?

Yang Fengyu: We are not exclusive of all scenarios. UniX AI’s modular hardware solution can be adapted to many different scenarios. At the same time, we have a set of motion primitive algorithms that decouple perception and operation to maximize the use of data, and our portability to scenes will be very strong. Although every product has its boundaries, we are willing to try and expand in various scenarios. We are also running through some important business scenarios to help consumers.
00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer
This site: What is the so-called supply chain cost advantage?

Yang Fengyu: We have a group of experienced supply chain management experts in our team who have mastered mass production-level cost control methods and can apply them to the robot supply chain. Although the robot industry has not yet rolled out prices on a large scale, we have controlled costs at the mass production level from the beginning to ensure that the products can reach prices acceptable to consumers. We are confident that through effective cost control, our products will be extremely competitive in price and provide strong support for the company's development.

This site: What is the price range of the upcoming products?

Yang Fengyu: It’s not convenient for me to disclose this now, but I can guarantee that it must be a very surprising price.

This site: How do you plan to get to the end?

Yang Fengyu: Our logic towards the end is very simple, We need a certain amount of high-quality real data. The key lies in how to obtain this data. For example, take autonomous driving as an example. Tesla's FSD can reach the end because it took 6 to 8 years to continuously have cars running on the road and collect data.

The robot industry is different. Everyone expects robots to do something automatically. We first developed several single-point scene functions to make everyone feel that the robot is useful or fun, and it is within the range of consumption ability, so that everyone will be willing to buy it.

Our supply chain has advantages and can lower the price, which is a very critical point. Through continuous feedback from users, we continue to optimize and iterate products, and finally create a universal embodied intelligent robot.

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

This site: What is the difficulty and significance of mass production of robots?

Yang Fengyu: It is actually very easy to make a DEMO. As long as you make one in the laboratory, it is a success. The difficulty of mass production lies in the fact that not one, but a hundred or a thousand units actually enter the user's home, testing the product's data security, operational stability, and underlying control reliability. This requires a strong after-sales team and continuous iteration. technical team. In addition, process is also very important, which is also an important indicator for testing mass production capabilities.

Of course there is no doubt about its significance. On the one hand, it reflects the competitiveness of the supply chain, and on the other hand, it shows the maturity of the technology. Who is the first person to eat crab? Who eats quickly and well? In addition, mass production can gain a certain first-mover advantage.

This site: After deciding to start a business, what are the initial team building ideas and the current team formation situation?

Yang Fengyu: From 0-1, the start-up team is very important. I am used to planning things at the top first, and then slowly deploying them to each level, like a waterfall, from top to bottom. First find the core key people and start working on them, then extend downwards to continuously improve the team and let the whole wheel turn.

From the end of last year to now, our team has grown very fast and has iterated three generations of products. At present, the team size has begun to take shape, but in the future we will continue to adjust and improve according to needs to make the company more competitive.

Acquiring talents is one of the most important things for a startup company. I have personally met most of the talents in our company. Many times, the CEO is not only the CEO, but also the "Chief Meaning Officer". He needs to explain to his peers what the value and significance of what we do are. It is very important to let them agree and go on the road together.

At the same time, at this stage, my management radius is very large and the management granularity is also very fine. It is very hard but necessary. Only when you have a comprehensive grasp and confirm that the company's direction is correct and stable can you spend more time on other aspects.

This site: How do you attract these talents?

Yang Fengyu: What essentially attracts everyone is the path to the end of embodied intelligence. In addition, it is the question of how to do it.

We have several highlights. First, we have a very strong supply chain cost advantage. Secondly, our team has strong execution and very fast iteration speed. Many candidates may think that we are not good enough when they first know about us. It was okay, but when I came back a few weeks later, I found that the scene had been completed and the progress was very fast. We also have talents from some of the top domestic robotics companies who have actively asked to join us.

This site: What is the current source of funds?

Yang Fengyu: We will disclose it at the appropriate time.

This site: Is there any external financing plan?

Yang Fengyu: The current feedback from investors is very positive. We welcome investors who share our vision of universal embodied intelligence to stay with us for the long term.

This site: Could you please give us a detailed introduction to your upcoming products and future market plans?

Yang Fengyu: The robot we are about to mass-produce is called Wanda, which is a wheeled humanoid dual-arm robot. In the first technical video we released, you can see some of its features, but this is not all. There will be more surprise details when we launch it to consumers in September.

Ultimately, the product UniX AI hopes to deliver to consumers is a universal embodied intelligent robot that not only serves the family, but can also accompany people to more and further places and provide more functions , which requires us to continue to develop technically, and also requires collaborative co-creation between the company and users. You can't reach a thousand miles without taking small steps, so let's start with the first step.

00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI Pioneer

more Tao
00后CEO杨丰瑜:耶鲁博士回国创业,五个月造出首款「可量产」人形机器人|AI PioneerWang Changhu
Xia Lixue | Gao JiyangDemi Guo
Li Yan
Contact the author: jjingl- (please indicate name-company-position when adding)

以上是00後CEO楊豐瑜:耶魯博士回國創業,五個月造出首款「可量產」人形機器人|AI Pioneer的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn