搜尋
首頁科技週邊人工智慧圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

這幾天,AI屆的盛會-ICLR在維也納舉辦。

OpenAI、Meta、Google、智譜AI等世界前沿AI科技企業齊聚一堂。

現場名流雲集,星光耀眼,走幾步就能偶遇一位發過顛覆性paper的大咖。

毫無意外地,ICLR 2024展間也變成了追星現場。熱鬧的氣氛,快把屋頂掀翻了。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

現場追星圖靈巨頭

#圖靈三巨頭中的著名「e人」LeCun,提前就在X上大方公佈出自己的行程,滿懷期待地等著和粉絲們相見了。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

在留言區,不只粉絲興奮打卡,甚至還有準備現場遞履歷的。

粉絲們果然不虛此行,在現場,LeCun口若懸河地講解,熱情的觀眾們在周圍形成密實的包圍圈。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

言歸正傳,在整個ICLR活動上,Meta團隊將分享25餘篇論文和兩個研討會。這次,LeCun團隊在ICLR上發表了以下兩篇論文。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文網址:https://arxiv.org/abs/2305.19523

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文地址:https://arxiv.org/abs/2311.12983

另一位圖靈巨頭Yoshua Bengio,也顯示了自己的超高人氣。

現場觀眾總結道:「一個人真的需要在他的領域中做到獨一無二,才能讓他的會議室外排起如此長的隊伍!」

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

先前LeCun和Hinton都對此發表過言辭激烈的意見,Bengio的態度似乎一直比較模糊,迫不及待想知道他對於AGI是什麼看法了。在即將到來的5月11日,他將會在一場關於AGI的Workshop中發表演說。

值得一提的是,Bengio團隊也在今年的ICLR上獲得了傑出論文榮譽提名。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文網址:https://openreview.net/pdf?id=Ouj6p4ca60

#GoogleMeta隔壁,智譜AI也在

現場,Google開源模型Gema、機器人智能體背後框架Robotics Transformers,以及其他開創性的研究一併呈現。

緊鄰Meta和谷歌,展廳中間有一家非常亮眼的公司-智譜AI。

現場的童鞋正為大家介紹GLM-4、ChatGLM等一系列研究成果。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

這一系列展示,引起了許多國外學者的圍觀。

現場的近兩千名與會嘉賓和學者,認真聽了GLM大模型技術團隊的介紹。

介紹內容包含了GLM系列大模型的多項前沿研究成果,涵蓋數學、文生圖、影像理解、視覺UI理解、Agent智能體等領域。

在現場,大家熱烈討論起了對Scaling Law的看法。而GLM團隊,對此也有獨到見解-

「相較於模型大小或訓練運算量,智慧湧現與預訓練損失有較緊密的連結。」

例如,著名的OpenAI 996研究員Jason Wei,認真讀過智譜AI這篇講預訓練損失的論文後,表示十分讚歎。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文中,團隊透過訓練30 個不同參數和資料規模LLM,評估了其在12個中英文資料集上的表現。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文網址:https://arxiv.org/abs/2403.15796

結果觀察到,只有當預訓練損失低於某個閾值時,LLM會出現湧現能力。

而且,從預訓練損失的角度定義「湧現能力」,效果優於僅依賴模型參數或訓練量。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

智譜AI的這段表現,也讓越來越多外國網友意識到--

##19歲獲得博士的Stability AI研究主任Tanishq表示,CogVLM這類最有競爭力、為開源生態做出重大貢獻的開源基礎模型,就是來自中國。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

這位遊戲工作室的前CEO,去年就開始用CogVLM和Stable Diffusion做完整的開源版本了。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

是的,自CogVLM自發布之後,其強大的能力便引起了外國網友的驚呼。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

在今年1月的LLM排行榜中,也有人發現—

#當時Gemini和GPT-4V遠遠領先任何開源LLM,唯一一個例外,就是CogVLM。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

可見,這波國產大模型出海,智譜AI已經悶聲不響地在國外建立了自己的巨大影響力。

特邀演講

展廳精彩演講之外,今年的ICLR,共邀請了七位特邀演講嘉賓,分享他們對AI的見解。

有來自GoogleDeepMind的研究科學家Raia Hadsell,喬治亞理工學院副教授&FAIR首席科學家Devi Parik,有來自馬克斯普朗克電腦科學研究所(MPI-SWS)的主任Moritz Hardt,唯一中國團隊是智譜AI 的GLM 大模型技術團隊。

Raia Hadsell

GoogleDeepMind科學家Raia Hadsell的演講主題是-「在人工智慧發展的起伏過程中學習:通往AGI道路上的意外真理」。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

經過數十年的穩定發展和偶爾的挫折後,AI正處於一個關鍵的轉折點。

AI產品已經爆炸式進入主流市場,我們還未觸及scaling紅利的天花板,因此整個社區都在探討下一步的方向。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

在這次的演講中,基於20多年在AI領域的經驗,Raia探討了我們對AGI發展之路的假設,如何隨時間發展而變化。

同時,她也揭示了,在這個探索的過程中,我們得到的意外發現。

從強化學習到分散式架構,再到神經網絡,已經在科學領域發揮潛在的革命性作用。

Raia認為,透過汲取過去的經驗教訓,可以為AI未來的研究方向提供重要的洞見。

Devi Parikh

另一邊,FAIR首席科學家Devi Parik給所有人講述了,自己生活中的故事。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

從演講題目可見略知,Parik的分享內容,非比尋常。

在ICLR大會上,在解釋為什麼科技環境是現在這個樣子時,大家會專注於針對網路、大數據和算力的發展,展開討論。

然鵝,鮮少有人關注那些微小,但重要的個人故事。

其實,每個人的故事,都可以匯聚成為推動科技進步的重要力量。

透過這種方式,我們可以彼此學習,互相激勵。這讓我們在追求目標時,更加堅韌和有效率。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

Moritz Hardt

#德國MPI-SWS主任Moritz Hardt帶來了「新興的科學基準”的演講。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

顯然,基準測試成為機器學習領域的「核心支柱」。

自1980年代以來,雖然人類在這個研究範式下取得了許多成就,但對其深層的理解仍然有限。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

在此次演講中,Hardt透過一系列選定的實證研究和理論分析,探索基準測試作為一門新興科學的基本原理。

他具體討論了標註錯誤對資料品質的影響、模型排名的外部驗證性,以及多任務基準測試的前景。

同時,Hard也展示了許多案例研究。

這些挑戰了我們的傳統看法,也突顯了發展科學基準測試的重要性和益處。

GLM Team

中國這邊,智譜​​AI的GLM大模型技術團隊,也帶來了「ChatGLM通往AGI之路”的精彩演講。

值得一提的是,這也是國內「首次」在國際頂尖會議上展示大模型相關的主題演講。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

這次演講,首先從中國的角度,介紹AI在過去幾十年的發展歷程。

同時,他們以ChatGLM為例,闡述自身在實踐過程中所獲得的理解與洞見。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

2024 AGI前瞻:GLM 4.5、 GLM-OS、 GLM-zero

在ICLR上,GLM大模型團隊介紹了面向AGI的GLM三大技術趨勢。

通往AGI的必經之路在哪裡?

業界對此意見不一。有人認為是智能體,有人認為是多模態,有人說,Scaling Law是通往AGI的必要非充分條件。

而LeCun堅持認為,LLM是通往AGI的一條歧路,靠LLM帶不來AGI。

對此,團隊也提出了自己的獨特觀點。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

首先,他們講到了GLM-4的後續升級版本,也就是GLM-4.5及其升級模型。

GLM-4的後續升級版,將基於超級認知(SuperIntelligence)和超級對齊(SuperAlignment)技術,同時在原生多模態領域和AI安全領域有長足進步。

GLM大模型團隊認為,在通往AGI的路上,文本是最關鍵的基礎。

而下一步,則應該把文字、圖像、視訊、音訊等多種模態混合在一起訓練,變成一個真正的「原生多模態模型」。

同時,為了解決更複雜的問題,他們也引進了GLM-OS概念,也就是以大模型為中心的通用計算系統。

這個觀點,與Karpathy先前提出的大模型作業系統的觀點,不謀而合。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

在ICLR現場,GLM大模型團隊詳細介紹了GLM-OS的實作方式:

基於現有的All-Tools能力,再加上記憶體記憶(memory)和自我回饋(self-reflection)能力,GLM-OS有望成功模仿人類的PDCA機制,即Plan-Do-Check-Act循環。

具體來說就是,先做出計劃,然後試一試形成回饋,調整規劃然後再行動以期達到更好的效果。

依賴PDCA循環機制,LLM便可以自我回饋與自主進化──恰如人類自己所做的一樣。

此外,GLM大模型團隊也透露,自2019年以來,團隊就一直在研究名為GLM-zero的技術,旨在研究人類的「無意識」學習機制。

「當人在睡覺的時候,大腦依然在無意識地學習。」

GLM大模型團隊表示,「無意識」學習機制是人類認知能力的重要組成部分,包括自我學習、自我反思和自我批判。

人腦中存在著「回饋」和「決策」兩個系統,分別對應LLM大模型和記憶體記憶兩部分。

因此,GLM-zero的相關研究將進一步拓展人類對意識、知識、學習行為的理解。

儘管還處於非常早期的研究階段,但GLM-zero可以視為通往AGI的必經之路。

而這,也是GLM大模型團隊首次向外界公開此技術趨勢。

國內頂流技術團隊

2020年底,GLM大模型技術團隊研發了GLM預訓練架構。

2021年訓練完成百億參數模型GLM-10B,同年利用MoE架構成功訓練出收斂的兆稀疏模型。

2022年也合作研發了中英雙語千億級超大規模預訓練模型GLM-130B並開源。

而過去一年裡,團隊幾乎每3-4個月,就完成一次基座大模型的升級,目前已經更新到了GLM-4版本。

不僅如此,作為國內最早入局LLM公司,智譜AI曾在2023年就設立了一個雄心勃勃的目標-全線對標OpenAI。

GLM大模型技術團隊建立了基於AGI願景的完整大模型產品矩陣。

在GLM系列之外,還有CogView文生圖模型、CodeGeeX程式碼模型,多模態理解模型CogVLM,再到GLM-4V多模態大模型和All-Tools功能以及AI助理智譜清言。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

同時,GLM大模型技術團隊的研究人員,在業界有著極高的影響力。

例如,圈裡爆火的李飛飛主講史丹佛大學CS25課程,每次都會邀請Transformer研究前沿的專家,分享自己的最新突破。

而目前已經確定,CS25課程的嘉賓中,就有來自智譜AI的研究員。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

CogVLM

團隊開發的開源視覺語言模型CogVLM,一經發布就引發了業界關注。

3月Stability AI公佈的論文就顯示,因性能太出色,CogVLM直接被Stable Diffufion 3拿來做圖像標註了。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文網址:https://arxiv.org/abs/2403.03206

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

CogAgent

在此基礎之上,基於CogVLM改進的開源視覺語言模型CogAgent,主要針對的是使用者圖形介面GUI的理解。

而CogAgent的相關論文,已經被國際電腦視覺領域級別最高的學術會議CVPR 2024收錄。

要知道,CVPR以錄取嚴格著稱,今年論文錄取率只有約2.8%。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文網址:https://arxiv.org/abs/2312.08914

ChatGLM-Math

針對LLM解決數學問題,GLM大模型團隊提出了「Self-Critique」的迭代訓練方法。

即透過自我回饋機制,幫助LLM同時提升語言和數學的能力。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

論文網址:https://arxiv.org/abs/2404.02893

此方法,包含了兩個關鍵步驟:

首先訓練一個從LLM本身產生「Math-Critique」模型,以評估模型產生數學問題答案,並提供回饋訊號。

其次,通过拒绝采样微调和DPO,利用新模型对LLM自身的生成进行监督。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

GLM大模型团队还设计了MATHUSEREVAL基准测试集,以评估新模型数学能力,结果如下:

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

显而易见,新方法显著提升了LLM的数学问题解决能力,同时仍能提升其语言能力。重要的是,它在某些情况下优于参数量增加两倍的大模型。

GLM-4跻身全球第一梯队

在OpenCompass 2.0基准测试中,智谱AI新一代基座大模型的实力不容小觑。

在总榜排名中,GLM-4位列第三,位居国内榜首。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

在不久前SuperBench团队发布的《SuperBench大模型综合能力评测报告》中,GLM-4也跻身全球第一梯队。

特别是在最关键的语义理解,智能体能力上,GLM-4更是国内第一,力压一众竞争对手。

圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像

刚刚过去的大模型元年,热闹非凡的百模大战打了一年。

2024年,若想化身为AGI元年,全世界大模型团队还有很长的路要走。

以上是圖靈巨頭現身ICLR,頂會現場瘋狂追星LeCun、Bengio!中國團隊三大技術趨勢引爆AGI新想像的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
ai合并图层的快捷键是什么ai合并图层的快捷键是什么Jan 07, 2021 am 10:59 AM

ai合并图层的快捷键是“Ctrl+Shift+E”,它的作用是把目前所有处在显示状态的图层合并,在隐藏状态的图层则不作变动。也可以选中要合并的图层,在菜单栏中依次点击“窗口”-“路径查找器”,点击“合并”按钮。

ai橡皮擦擦不掉东西怎么办ai橡皮擦擦不掉东西怎么办Jan 13, 2021 am 10:23 AM

ai橡皮擦擦不掉东西是因为AI是矢量图软件,用橡皮擦不能擦位图的,其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

谷歌超强AI超算碾压英伟达A100!TPU v4性能提升10倍,细节首次公开谷歌超强AI超算碾压英伟达A100!TPU v4性能提升10倍,细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年,就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日,谷歌才首次公布了这台AI超算的技术细节。论文地址:https://arxiv.org/abs/2304.01433相比于TPU v3,TPU v4的性能要高出2.1倍,而在整合4096个芯片之后,超算的性能更是提升了10倍。另外,谷歌还声称,自家芯片要比英伟达A100更快、更节能。与A100对打,速度快1.7倍论文中,谷歌表示,对于规模相当的系统,TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式吗ai可以转成psd格式吗Feb 22, 2023 pm 05:56 PM

ai可以转成psd格式。转换方法:1、打开Adobe Illustrator软件,依次点击顶部菜单栏的“文件”-“打开”,选择所需的ai文件;2、点击右侧功能面板中的“图层”,点击三杠图标,在弹出的选项中选择“释放到图层(顺序)”;3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”;4、在弹出的“导出”对话框中,将“保存类型”设置为“PSD格式”,点击“导出”即可;

ai顶部属性栏不见了怎么办ai顶部属性栏不见了怎么办Feb 22, 2023 pm 05:27 PM

ai顶部属性栏不见了的解决办法:1、开启Ai新建画布,进入绘图页面;2、在Ai顶部菜单栏中点击“窗口”;3、在系统弹出的窗口菜单页面中点击“控制”,然后开启“控制”窗口即可显示出属性栏。

GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑Apr 04, 2023 am 11:55 AM

Yann LeCun 这个观点的确有些大胆。 「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。当然,被 Yann LeCun 指出问题的不只是自回归模型。在他看来,当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

ai移动不了东西了怎么办ai移动不了东西了怎么办Mar 07, 2023 am 10:03 AM

ai移动不了东西的解决办法:1、打开ai软件,打开空白文档;2、选择矩形工具,在文档中绘制矩形;3、点击选择工具,移动文档中的矩形;4、点击图层按钮,弹出图层面板对话框,解锁图层;5、点击选择工具,移动矩形即可。

AI抢饭碗成真!近500家美国企业用ChatGPT取代员工,有公司省下超10万美元AI抢饭碗成真!近500家美国企业用ChatGPT取代员工,有公司省下超10万美元Apr 07, 2023 pm 02:57 PM

自从ChatGPT掀起浪潮,不少人都在担心AI快要抢人类饭碗了。然鹅,现实可能更残酷QAQ......据就业服务平台Resume Builder调查统计,在1000多家受访美国企业中,用ChatGPT取代部分员工的,比例已达到惊人的48%。在这些企业中,有49%已经启用ChatGPT,还有30%正在赶来的路上。就连央视财经也为此专门发过一个报道:相关话题还曾一度冲上了知乎热榜,众网友表示,不得不承认,现在ChatGPT等AIGC工具已势不可挡——浪潮既来,不进则退。有程序员还指出:用过Copil

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版