最近,網路大佬紛紛投身大模型賽道。
昨天,李沐大神離職亞馬遜、去做大模型的消息,如同驚雷一般炸響了大家的社交網絡。
緊接著,今天又曝出前快手AI核心大佬李岩在2022年離職快手後成立的新公司,做的也是大模型。
顯然,自從ChatGPT讓全世界看到了AI上天入地般的應用場景,國內企業的AI模型層競爭,已經開始白熱化了。
#李岩在2022年下半年成立了AI公司「元石科技」,主要進行多模態大模型的研發。
李岩是工號在75上下的快手老員工,也是快手AI技術研發的核心人物。
2015年11月,在時任快手CEO的宿華的支持下,李岩組建了內部第一個深度學習部門DL(Deep Learning)組,目標是構建演算法模型對違法違規的影片內容進行辨識。
隨後,快手對影片內容理解產生了更多的需求。 2016年,李岩將團隊的名字從DL組改為MMU(Multimedia understanding,多媒體內容理解)組,在解決安全合規問題之外,涉獵語音、文字、圖像等多種形式的演算法模型研發。
在2018年的CNCC大會上,李岩便以題為「多模態內容生產與理解」的演講,強調了多模態模型技術的重要性:
以我們常刷的短影片為例,除了視覺、聽覺和文字這些多模態訊息外,使用者的行為也是另一種模態的數據。
如此一來,影片的本身再加上使用者的行為,就共同構成了一個非常複雜的多模態問題。
而多模態研究的目的便是,讓人機互動的方式變得越來越自然和舒適。
然而,多模態的研究難度頗高。
一方面要面對單模態的語意鴻溝問題,以及如何針對不同模態的資料進行綜合建模的異質鴻溝問題;另一方面,還要解決由於多模態資料集建構困難而造成的資料缺失問題。
當時,學術界有不少研究還是停留在單模態領域,而李岩則堅定地認為,未來多模態會成為更有價值的研究方向。
在快手的經歷,讓李岩對於AI在短片上的生態有了第一線的深刻理解,2021年,他選擇從快手離職。
2022年下半年,他成立了元石科技,根據36氪的獨家求證,元石科技主攻的就是多模態大模型的研發。
而昨天,李沐大神疑似加入大模型創業的消息,也瞬間在社群網路上刷螢幕。
根據公號「親愛的資料」訊息,「參數伺服器之父」Alex Smola在今年2月離職亞馬遜,並創辦了一家名為Boson.ai人工智慧公司。
至於這家新公司的介紹資料不多,目前官方頁面還在建設中。
#連結:https://boson.ai/
可以肯定的是,要做大模型相關的項目。
另根據Alex的領英主頁介紹,「我們正在做一件大事。如果你對可擴展基礎模型感興趣,請聯繫我。」
值得注意的是,在這家公司GitHub主頁上,亞馬遜首席科學家李沐也貢獻了程式碼。
因此,外界猜測李沐現已加入了Boson.ai,跟隨導師一起去創業了。
不過,到目前為止,其主頁還未更新。
李沐和Alex Smola曾在2016年創辦了一家名為Marianas Labs資料分析演算法公司。
當時,李沐任CTO兼共同創辦人。
李沐曾在《博士這五年》一文中提到,
當時深度學習的火熱導致各種巨資收購新創部門不斷。
Alex便和他拿了幾十萬的天使投資風風火火乾了好一陣子,Alex寫爬蟲,他自己跑模型,後來賣給一個小上市公司公司1-Page。
#要說師徒二人的相識最早是在卡內基美隆大學(CMU )。
2012年9月,李沐前往CMU深造,師從的便是Alex Smola。
當時,Alex還在Google任職,沒有經費,就把他丟給了Dave Andersen。因此,李沐便有了兩個導師,一個做機器學習,一個做分散式系統。
在CMU的前半年,李沐每週都會與兩位導師一起聊一個小時。
由於兩位導師風格迥異,而Alex反應特別快,想要跟上他的節奏很難。若想闡述自己的想法,需要做更多的功課。
而Dave會幫助李沐把一個東西理解透,不會給出很多想法。
在兩位導師的輔導下,李沐迅速成長。
在CMU求學的第二年,正當餘凱等人在做深度學習,李沐便也加入這波研究熱潮。
基於對分散式深度學習框架的興趣,他選擇與陳天奇合作,將CXXNet作為起點,做深度學習相關專案。
當兩人一起寫xgboost 分散式啟動腳本時,便發現檔案讀取可以是多個專案共同使用。
為了避免重複造輪子,李沐和陳天奇在合力在Github上創建了一個叫DMLC的組織,隨後更是創建了隨後大獲成功的MXNet。
#2016年7月,Alex加入了亞馬遜。同時,李沐便帶著MXNet先以兼職身分加入亞馬遜,畢業後選擇留下來。
2019年期間,師徒兩人也曾在UC柏克萊一起講課。
2021年,兩人在史丹佛大學也一起教授「Practical Machine Learning」。
#值得一提的是,《動手學習深度學習》這本書便是由李沐,美國伊利諾大學香檳分校電腦科學博士Aston Zhang,還有導師Alex一起寫。
這本書推出後便大受歡迎。身為MXNet的作者之一,李沐的這本《動手學深度學習》也是使用 MXNet 框架寫成的
多模態的方向,是李岩很早就想做的。而李沐追隨導師去創業,或許多少都受到了ChatGPT爆火的影響。
而國內企業的AI模型層競爭,已經開始白熱化了。現在的大模型賽道中,擠滿了巨頭派、大佬派、海歸/大廠高層派、小新創公司轉型派、教授派、醬油派等各路選手。
2月13日,已經從美團退休2年的王慧文帶著一紙「AI英雄榜」重回大眾視野,稱自己將拿出5000萬美元「有資入組」,且「不關心職位、薪資和title,求組隊」。
前有王慧文把大模型創業的門票拉高到5000萬美金之後,後有「出門問問」創辦人李志文官宣下場大模型競賽。
李志文曾在2020年領導團隊,訓練出大模型UCLAL
另外,還有前搜狗CEO王小川也發文隱晦地宣布,自己即將進入「中國的OpenAI」的戰場,並向36氪承認自己在快速籌備中。
2月26日,銜遠科技的創辦人、首席科學家週伯文也發布一則消息指出招募合夥人,一起打造中國版ChatGPT。
最近各種需求的激增,已經顯示了國內產生人工智慧產品的潛在市場大得驚人。
ChatGPT的爆火,意味著奇點已至,它引發了更底層、更深層的變化,新一代AI將融合物理世界和資訊世界,實現知識、計算、推理的閉環。
短短兩天內,就有兩位大佬被曝下場創業,開闢大模型賽道。而國內巨頭們預告的記者會,都將在幾個月內召開。
所以,這場自開年就打響的AI大模型國內追逐賽,或許馬上就能看到有選手衝刺終點了。
以上是大神李沐、快手元老李岩被曝離職後轉投大模型,ChatGPT掀起AI創業狂飆的詳細內容。更多資訊請關注PHP中文網其他相關文章!