图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象-人工智能-PHP中文网

首页

科技周边

人工智能

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 30, 2024 am 11:17 AM

ai图灵

这几天，AI届的盛会——ICLR在维也纳举办。

OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。

现场名流云集，星光耀眼，走几步就能偶遇一位发过颠覆性paper的大咖。

毫无意外地，ICLR 2024展厅也变成了追星现场。热闹的气氛，快把屋顶掀翻了。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

现场追星图灵巨头

图灵三巨头中的著名「e人」LeCun，提前就在X上大方公布出自己的行程，满怀期待地等着和粉丝们相见了。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

在评论区，不仅有粉丝激动打卡，甚至还有准备现场递简历的。

粉丝们果然不虚此行，在现场，LeCun口若悬河地讲解，热情的观众们在周围形成密实的包围圈。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

言归正传，在整个ICLR活动上，Meta团队将分享25余篇论文和两个研讨会。这次，LeCun团队在ICLR上发表了以下两篇论文。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://arxiv.org/abs/2305.19523

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://arxiv.org/abs/2311.12983

另一位图灵巨头Yoshua Bengio，也显示了自己的超高人气。

现场观众总结道：「一个人真的需要在他的领域中做到独一无二，才能让他的会议室外排起如此长的队伍！」

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

此前LeCun和Hinton都对此发表过言辞激烈的意见，Bengio的态度似乎一直比较模糊，迫不及待想知道他对于AGI是什么看法了。在即将到来的5月11日，他就会在一场关于AGI的Workshop中发表演讲。

值得一提的是，Bengio团队也在今年的ICLR上获得了杰出论文荣誉提名。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://openreview.net/pdf?id=Ouj6p4ca60

谷歌Meta隔壁，智谱AI也在

现场，谷歌开源模型Gema、机器人智能体背后框架Robotics Transformers，以及其他开创性的研究一并呈现。

紧挨着Meta和谷歌，展厅中间有一家非常亮眼的公司——智谱AI。

现场的童鞋正为大家介绍GLM-4、ChatGLM等一系列研究成果。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

这一系列展示，引起了众多国外学者的围观。

现场的近两千名与会嘉宾和学者，认真听了GLM大模型技术团队的介绍。

介绍内容包括了GLM系列大模型的多项前沿研究成果，涵盖数学、文生图、图像理解、视觉UI理解、Agent智能体等领域。

在现场，大家热烈讨论起了对Scaling Law的看法。而GLM团队，对此也有独到见解——

「相比模型大小或训练计算量，智能涌现和预训练损失有更加紧密的联系。」

比如，著名的OpenAI 996研究员Jason Wei，认真读过智谱AI这篇讲预训练损失的论文后，表示十分赞叹。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文中，团队通过训练30 个不同参数和数据规模LLM，评估了其在12个中英文数据集上的表现。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://arxiv.org/abs/2403.15796

结果观察到，只有当预训练损失低于某个阈值时，LLM会出现涌现能力。

而且，从预训练损失的角度定义「涌现能力」，效果优于仅依赖模型参数或训练量。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

智谱AI的此番表现，也让越来越多外国网友意识到——

19岁获得博士的Stability AI研究主任Tanishq表示，CogVLM这类最有竞争力、为开源生态做出重大贡献的开源基础模型，就是来自中国。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

这位游戏工作室的前CEO，去年就开始用CogVLM和Stable Diffusion做完整的开源版本了。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

是的，自CogVLM自发布之后，其强大的能力便引起了外国网友的惊呼。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

在今年1月的LLM排行榜中，也有人发现——

当时Gemini和GPT-4V远远领先于任何开源LLM，唯一一个例外，就是CogVLM。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

可见，这波国产大模型出海，智谱AI已经闷声不响地在国外建立了自己的巨大影响力。

特邀演讲

展厅精彩演示之外，今年的ICLR，共邀请了七位特邀演讲嘉宾，分享他们对AI的见解。

有来自谷歌DeepMind的研究科学家Raia Hadsell，佐治亚理工学院副教授&FAIR首席科学家Devi Parik，有来自马克斯·普朗克计算机科学研究所（MPI-SWS）的主任Moritz Hardt，唯一一家中国团队是智谱AI 的GLM 大模型技术团队。

Raia Hadsell

谷歌DeepMind科学家Raia Hadsell的演讲题目是——「在人工智能发展的起伏过程中学习：通向AGI道路上的意外真理」。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

经过数十年的稳定发展和偶尔的挫折后，AI正处在一个关键的拐点。

AI产品已经爆炸式地进入主流市场，我们还未触及到scaling红利的天花板，因此整个社区都在探讨下一步的方向。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

在这次的演讲中，基于20多年在AI领域的经验，Raia探讨了我们对AGI发展之路的假设，如何随时间发展而变化。

与此同时，她还揭示了，在这个探索的过程中，我们得到的意外发现。

从强化学习到分布式架构，再到神经网络，已经在科学领域发挥着潜在的革命性作用。

Raia认为，通过汲取过去的经验教训，可以为AI未来的研究方向提供重要的洞见。

Devi Parikh

另一边，FAIR首席科学家Devi Parik给所有人讲述了，自己生活中的故事。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

从演讲题目可见略知，Parik的分享内容，非比寻常。

在ICLR大会上，在解释为什么技术环境是现在这个样子时，大家会重点针对互联网、大数据和算力的发展，展开讨论。

然鹅，鲜有人关注那些微小，但重要的个人故事。

其实，每个人的故事，都可以汇聚成为推动技术进步的重要力量。

通过这种方式，我们可以彼此学习，相互激励。这让我们在追求目标时，更加坚韧和高效。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

Moritz Hardt

德国MPI-SWS主任Moritz Hardt带来了「新兴的科学基准」的演讲。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

显然，基准测试成为机器学习领域的「核心支柱」。

自20世纪80年代以来，虽然人类在这个研究范式下取得了诸多成就，但对其深层次的理解仍然有限。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

在此次演讲中，Hardt通过一系列选定的实证研究和理论分析，探索基准测试作为一门新兴科学的基本原理。

他具体讨论了标注错误对数据质量的影响、模型排名的外部验证性，以及多任务基准测试的前景。

与此同时，Hard还展示了许多案例研究。

这些挑战了我们的传统看法，还突显了发展科学基准测试的重要性和益处。

GLM Team

中国这边，智谱AI的GLM大模型技术团队，也带来了「ChatGLM通往AGI之路」的精彩演讲。

值得一提的是，这也是国内「首次」在国际顶级会议上展示大模型相关的主题演讲。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

这次演讲，首先从中国的角度，介绍AI在过去几十年的发展历程。

同时，他们以ChatGLM为例，阐述自身在实践过程中获得的理解和洞见。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

2024 AGI前瞻：GLM 4.5、 GLM-OS、 GLM-zero

在ICLR上，GLM大模型团队介绍了面向AGI的GLM三大技术趋势。

通往AGI的必经之路在哪里？

业界对此意见不一。有人认为是智能体，有人认为是多模态，有人说，Scaling Law是通往AGI的必要非充分条件。

而LeCun坚持认为，LLM是通往AGI的一条歧路，靠LLM带不来AGI。

对此，团队也提出了自己的独特观点。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

首先，他们讲到了GLM-4的后续升级版本，即GLM-4.5及其升级模型。

GLM-4的后续升级版，将基于超级认知（SuperIntelligence）和超级对齐（SuperAlignment）技术，同时在原生多模态领域和AI安全领域有长足进步。

GLM大模型团队认为，在通往AGI的路上，文本是最关键的基础。

而下一步，则应该把文本、图像、视频、音频等多种模态混合在一起训练，变成一个真正的「原生多模态模型」。

同时，为了解决更加复杂的问题，他们还引入了GLM-OS概念，即以大模型为中心的通用计算系统。

这一观点，与Karpathy此前提出的大模型操作系统的观点，不谋而合。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

在ICLR现场，GLM大模型团队详细介绍了GLM-OS的实现方式：

基于已有的All-Tools能力，再加上内存记忆（memory）和自我反馈（self-reflection）能力，GLM-OS有望成功模仿人类的PDCA机制，即Plan-Do-Check-Act循环。

具体来说就是，首先做出计划，然后试一试形成反馈，调整规划然后再行动以期达到更好的效果。

依靠PDCA循环机制，LLM便可以自我反馈和自主进化——恰如人类自己所做的一样。

此外，GLM大模型团队还透露，自2019年以来，团队就一直在研究名为GLM-zero的技术，旨在研究人类的「无意识」学习机制。

「当人在睡觉的时候，大脑依然在无意识地学习。」

GLM大模型团队表示，「无意识」学习机制是人类认知能力的重要组成部分，包括自我学习、自我反思和自我批评。

人脑中存在着「反馈」和「决策」两个系统，分别对应着LLM大模型和内存记忆两部分。

因此，GLM-zero的相关研究将进一步拓展人类对意识、知识、学习行为的理解。

尽管还处于非常早期的研究阶段，但GLM-zero可以视为通向AGI的必经之路。

而这，也是GLM大模型团队首次向外界公开这一技术趋势。

国内顶流技术团队

2020年底，GLM大模型技术团队研发了GLM预训练架构。

2021年训练完成百亿参数模型GLM-10B，同年利用MoE架构成功训练出收敛的万亿稀疏模型。

2022年还合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。

而过去一年里，团队几乎每3-4个月，就完成一次基座大模型的升级，目前已经更新到了GLM-4版本。

不仅如此，作为国内最早入局LLM公司，智谱AI曾在2023年就设立了一个雄心勃勃的目标——全线对标OpenAI。

GLM大模型技术团队构建了基于AGI愿景的完整大模型产品矩阵。

在GLM系列之外，还有CogView文生图模型、CodeGeeX代码模型，多模态理解模型CogVLM，再到GLM-4V多模态大模型和All-Tools功能以及AI助手智谱清言。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

与此同时，GLM大模型技术团队的研究人员，在业界有着极高的影响力。

比如，圈里爆火的李飞飞主讲斯坦福大学CS25课程，每次都会邀请Transformer研究前沿的专家，分享自己的最新突破。

而目前已经确定，CS25课程的嘉宾中，就有来自智谱AI的研究员。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

CogVLM

团队开发的开源视觉语言模型CogVLM，一经发布就引发了业界关注。

3月Stability AI公布的一篇论文就显示，因性能太出色，CogVLM直接被Stable Diffufion 3拿来做图像标注了。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://arxiv.org/abs/2403.03206

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

CogAgent

在此基础之上，基于CogVLM改进的开源视觉语言模型CogAgent，主要针对的是用户图形界面GUI的理解。

而CogAgent的相关论文，已经被国际计算机视觉领域级别最高的学术会议CVPR 2024收录。

要知道，CVPR以录取严格著称，今年论文录取率只有约2.8%。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://arxiv.org/abs/2312.08914

ChatGLM-Math

针对LLM解决数学问题，GLM大模型团队提出了「Self-Critique」的迭代训练方法。

即通过自我反馈机制，帮助LLM同时提升语言和数学的能力。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

论文地址：https://arxiv.org/abs/2404.02893

这一方法，包含了两个关键步骤：

首先训练一个从LLM本身生成「Math-Critique」模型，以评估模型生成数学问题答案，并提供反馈信号。

其次，通过拒绝采样微调和DPO，利用新模型对LLM自身的生成进行监督。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

GLM大模型团队还设计了MATHUSEREVAL基准测试集，以评估新模型数学能力，结果如下：

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

显而易见，新方法显着提升了LLM的数学问题解决能力，同时仍能提升其语言能力。重要的是，它在某些情况下优于参数量增加两倍的大模型。

GLM-4跻身全球第一梯队

在OpenCompass 2.0基准测试中，智谱AI新一代基座大模型的实力不容小觑。

在总榜排名中，GLM-4位列第三，位居国内榜首。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

在不久前SuperBench团队发布的《SuperBench大模型综合能力评测报告》中，GLM-4也跻身全球第一梯队。

特别是在最关键的语义理解，智能体能力上，GLM-4更是国内第一，力压一众竞争对手。

图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象

刚刚过去的大模型元年，热闹非凡的百模大战打了一年。

2024年，若想化身为AGI元年，全世界大模型团队还有很长的路要走。

以上是图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

使用Chatgpt开发应用程序！易于理解实际步骤和提示的解释May 12, 2025 pm 05:03 PM

对于有兴趣使用ChatGpt开发应用程序的开发人员的必看。在本文中，我们将仔细说明如何在每个开发阶段（从设计到测试）使用Chatgpt。我们还提供了有关各种应用程序的详细信息，可以通过合并ChatGpt以及在开发过程中要注意的优点和点来实现。我们还将讨论CHATGPT独有的观点，例如对API使用的限制，并解释在建立适当的环境以实现高效和有效应用程序开发时考虑的关键点。对于那些试图使用AI技术开发创新应用程序的人，我们为开发的必要知识和解决方案提供了必要的知识和解决方案

如何将Chatgpt用于英语对话和学习英语！介绍如何使用它和提示的示例May 12, 2025 pm 05:01 PM

使用chatgpt的最流行方法是将其用作学习英语和导师的工具。在本文中，我们将详细解释如何使用Chatgpt提高您的英语听力和口语技能，并提供具体示例。我们介绍了对ChatGpt独有的有效学习方法，例如对英语作品的更正，英语语法的解释以及通过日常对话和角色扮演练习英语对话。它还涉及如何制定针对英语水平量身定制的学习计划，以及在使用chatgpt时要谨慎的观点。我刚刚开始学习英语

Chatgpt的内存功能'内存”介绍了您忘记说话，如何使用它以及实际响应的原因！May 12, 2025 pm 04:59 PM

ChatGPT的记忆功能“Memory”让您告别对话中断！您是否也曾因ChatGPT忘记之前的对话内容而烦恼？现在，ChatGPT推出了全新的内存功能“Memory”，让流畅对话成为现实。本文将深入浅出地解释ChatGPT对话中断的原因，并提供实用技巧，助您提升ChatGPT使用体验。 ChatGPT的记忆功能“Memory” 内存功能设置界面 ChatGPT的“Memory”功能可以记住用户的偏好和信息，从而提升后续交互的个性化程度。例如，它可以记住您的职业、沟通风格以及之前的指令，让后续回

易于理解如何关闭ChatGpt历史记录！ [与PC和智能手机兼容]May 12, 2025 pm 04:57 PM

CHATGPT便利和隐私问题：打开和关闭历史特征和权衡 Chatgpt是一个有用的工具，但是有关处理历史记录的处理的隐私问题不可忽视。在本文中，我们将解释如何关闭Chatgpt中的历史功能及其优势和缺点。通过关闭历史记录和个性化的互动经验来了解保护隐私之间的平衡，并选择一种安全的方法来使用它。单击此处以获取有关Openai最新AI代理OpenAi Deep Research⬇️的更多信息 [chatg]

[免费]什么是Openai O3-Mini（Chatgpt O3Mini High）？解释主要功能和用法！May 12, 2025 pm 04:56 PM

Openai O3-Mini：一种经济高效的高性能推断模型近年来，OpenAI一直在发布包括GPT系列在内的创新模型，尤其是其大规模语言模型（LLM）。 Openai发布了最新且具有成本效益的模型，Openai O3-Mini，专门从事推断。这种快速有力的模型在科学，数学和编码等领域提供了高性能，从而大大扩展了小规模模型的可能性。在本文中，我们将介绍Openai O3-Mini的

chatgpt中的ng词是什么？列表的详尽解释和禁止的单词May 12, 2025 pm 04:54 PM

ChatGPT的禁忌词语：全面解析及其影响随着AI技术的飞速发展，基于自然语言处理的聊天机器人ChatGPT备受瞩目。然而，ChatGPT的使用中存在需要注意的“禁忌词语”，这些词语会限制其生成内容。本文将深入探讨哪些词语属于禁忌词语，为何设置禁忌词语，以及这些词语对ChatGPT使用有何影响。此外，我们将探讨如何规避禁忌词语，更有效地利用ChatGPT。希望本文能帮助您在充分发挥ChatGPT潜能的同时，有效管理伦理和法律风险。 OpenAI发布的最新AI代理“OpenAI Deep Re

易于理解的解释如何登录到chatgpt以及如何用日语开始！May 12, 2025 pm 04:45 PM

CHATGPT：从注册到登录和使用应用程序的详尽指南！近年来，包括Chatgpt在内的AI对我们的生活产生了重大影响。 Chatgpt将注意力吸引为允许自然对话的AI，但是您需要注册一个帐户并登录以使用它。在本文中，我们将以一种易于理解的方式解释初学者，如何注册和登录到chatgpt，如何启动应用程序版本以及故障排除。如果您正在考虑开始使用chatgpt或在注册困难时，请参阅此信息。目录登录到chatgpt

[Openai]什么是O4-Mini？解释主要功能，用法和费用结构May 12, 2025 pm 04:43 PM

最新的小型AI型号O4-Mini：高速，低价，高性能！ Openai发布了新的小型AI型号O4-Mini。与旗舰型号“ O3”不同，其吸引力是其高速和低价。在本文中，我们将详细解释O4-Mini的特征，其与O3的差异，其使用情况，安全性以及如何使用它。目录 O4-Mini的概述关键功能大约O4米尼高如何使用和费用结构 API使用和费用与Azure和GitHub Copilot一起使用

See all articles