OpenAI大神Karpathy最新分享：为什么OpenAI内部对AI Agents最感兴趣-人工智能-PHP中文网

首页

科技周边

人工智能

OpenAI大神Karpathy最新分享：为什么OpenAI内部对AI Agents最感兴趣

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 28, 2023 pm 01:35 PM

Andrej Karpathy这位OpenAI联合创始人最近在一个开发者活动上发表简短讲话，谈论了自己和OpenAI内部对AI Agents （人工智能代理人）的看法。

Andrej Karpathy 对比了过去开发AI Agent的困难和现在新技术工具下开发的新机会，他还不忘调侃自己在特斯拉的工作，是“被自动驾驶分了心”，他认为自动驾驶和VR都是糟糕的AI Agents的例子。

对于新的机会，Andrej Karpathy认为此刻正是再次回归神经科学，从中寻求灵感的时刻——正像在深度学习早期发生的那样。

另一方面，Andrej Karpathy认为普通人、创业者和极客在构建AI Agents方面相比OpenAI这样的公司更有优势，大家目前处于平等竞争的状态，因此他很期待看到这方面的成果。

他还透露，如果一篇论文提出了某种不同的训练方法，OpenAI内部的Slack上会嗤之以鼻，认为都是他们玩剩下的。他们将兴致勃勃地讨论最新的AI Agents论文。

OpenAI大神Karpathy最新分享：为什么OpenAI内部对AI Agents最感兴趣

以下是此次分享全文：

大家好。

我受邀就AI Agents 的话题说一些激励的话。我认为AI Agents在某种程度上跟我是很近的关系，让我以一个故事开始，这是一个非常早期的OpenAI的故事，那时OpenAI可能只有十几个人，在2016年左右，当时的潮流实际上是RL Agents（强化学习代理人）。

每个人都对建立代理人非常感兴趣，但在当时主要是基于游戏，人们的兴奋点围绕着像 Atari这样的游戏公司，而我当时在OpenAI的项目试图将RL Agents的重点放在用键盘和鼠标使用电脑上，而不是游戏。

我想让它们变得更有用，可以做很多工作，这个项目被称之为World of Bits。

我和几位同事最后发表了一篇论文。这篇论文并非令人惊艳，因为它实质上是基于RL强化学习方法的。我们的网页十分简洁，用户可以轻松预订航班或点餐等。

这一切显然是行不通的，因为技术还没有准备好，在那时做这些东西是不明智的。

事实证明，应该完全忘记AI Agents这件事，去做语言模型。

五年之后我们回到这里，期间我被自动驾驶分了一点心，但现在AI Agents重新酷了起来，而我们的工具箱完全不一样了，我们处理这些问题的方式也完全不同了。

实际上，你们所有人都对AI代理进行了研究，但可能没有采用强化学习方法。这太疯狂了，我不认为我们当时会预见到这一点。这简直太有趣了。

下面我花一点时间谈谈为什么AI Agents如此火爆。我想很明显，对很多人来说，AGI（通用人工智能）将充分利用AI Agents的能力，不是一个，而是很多个。也许将会出现数字实体的组织或文明，我认为这是非常鼓舞人心的，甚至有点疯狂。

不过，我也想为此泼点冷水。在我看来，有一类问题很容易在脑海中构思和演示，但要将其变为实实在在的产品却非常困难。很多事情都属于这一类，比如我想自动驾驶就是一个例子。

想象自动驾驶并构建演示汽车绕街区行驶很容易，但将其成为产品需要十年时间。同样的道理，我觉得VR也是如此，让它发挥作用需要十年时间。

我认为AI Agents某种程度上也是如此。虽然想象它的情景很容易令人激动，但我相信要真正使其发挥作用，需要投入十年时间来参与。

我想说的另一件事是，我认为现在回到神经科学并在某些方面再次从中获得灵感是很有趣的，深度学习的早期阶段就受到了神经科学的启发。

思考它们之间的关系是非常有趣的，特别是我认为很多人都把语言模型当作解决方案的一部分，但如何构建一个完整的，拥有人类所有认知能力的数字实体呢？

毫无疑问，我们一致认为我们需要一种潜在的系统来策划、思考和反思我们正在进行的活动，在这一点上神经科学发挥着重要作用。

比如，海马体是非常重要的，AI Agents中什么东西发挥着海马体的作用，用来实现储存记忆，标记检索等等这些功能？

我们已经初步了解了如何构建视觉和听觉皮层，但在AI Agents中还有很多未知的事物。

比如视觉游戏在AI Agents中是什么样子的？潜意识的所在地——丘脑在AI Agents中又相当于什么呢？

这非常有趣。事实上我今天带了一本神经科学的书，David Eagleman的《大脑与行为》，我发现这本书非常有趣和有启发性。

或许现在我们应该像以前一样，从神经科学中寻找一些有趣的灵感，并重新设计单个神经元。

最后我想用一些鼓励的话结尾。一个有趣但不明显的事情是，你们（指现场观众）构建的AI Agents实际上处于当代AI Agents能力的最前沿，所有的大型LLM机构比如OpenAI、DeFi等，我怀疑他们都没有处于最前沿。

你们正处于最前沿。

举个例子，OpenAI 非常擅长训练 Transformer 大语言模型。如果一篇论文提出了某种不同的训练方法，那么我们OpenAI内部的Slack群组里的讨论会类似于，哦是的，有人在两年半尝试过，它不起作用，我们对这种方法的来龙去脉非常了解。

但是当新的AI Agents论文出来的时候，我们都非常感兴趣，觉得它非常酷，因为我们的团队并没有花费五年时间在这上面，我们并不比你们更多掌握什么，我们正在与你们所有人一起竞争。

这就是我为什么认为你们处于AI Agents能力的最前沿的原因，这对AI Agents的发展来说是非常重要的。

以上是OpenAI大神Karpathy最新分享：为什么OpenAI内部对AI Agents最感兴趣的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：搜狐。如有侵权，请联系admin@php.cn删除

加固芬特的指南 - 分析VidhyaApr 28, 2025 am 09:30 AM

增强者通过教授模型根据人类反馈进行调整来震撼AI的开发。它将监督的学习基金会与基于奖励的更新融合在一起，使其更安全，更准确，真正地帮助

让我们跳舞：结构化运动以微调我们的人类神经网Apr 27, 2025 am 11:09 AM

科学家已经广泛研究了人类和更简单的神经网络（如秀丽隐杆线虫中的神经网络），以了解其功能。但是，出现了一个关键问题：我们如何使自己的神经网络与新颖的AI一起有效地工作

新的Google泄漏揭示了双子AI的订阅更改Apr 27, 2025 am 11:08 AM

Google的双子座高级：新的订阅层即将到来目前，访问Gemini Advanced需要$ 19.99/月Google One AI高级计划。但是，Android Authority报告暗示了即将发生的变化。最新的Google P中的代码

数据分析加速度如何求解AI的隐藏瓶颈Apr 27, 2025 am 11:07 AM

尽管围绕高级AI功能炒作，但企业AI部署中潜伏的巨大挑战：数据处理瓶颈。首席执行官庆祝AI的进步时，工程师努力应对缓慢的查询时间，管道超载，一个

Markitdown MCP可以将任何文档转换为Markdowns！Apr 27, 2025 am 09:47 AM

处理文档不再只是在您的AI项目中打开文件，而是将混乱变成清晰度。诸如PDF，PowerPoints和Word之类的文档以各种形状和大小淹没了我们的工作流程。检索结构化

如何使用Google ADK进行建筑代理？ - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理开发套件（ADK）的力量创建具有现实世界功能的智能代理！该教程通过使用ADK来构建对话代理，并支持Gemini和GPT等各种语言模型。 w

在LLM上使用SLM进行有效解决问题-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要：小型语言模型 (SLM) 专为效率而设计。在资源匮乏、实时性和隐私敏感的环境中，它们比大型语言模型 (LLM) 更胜一筹。最适合专注型任务，尤其是在领域特异性、控制性和可解释性比通用知识或创造力更重要的情况下。 SLM 并非 LLMs 的替代品，但在精度、速度和成本效益至关重要时，它们是理想之选。技术帮助我们用更少的资源取得更多成就。它一直是推动者，而非驱动者。从蒸汽机时代到互联网泡沫时期，技术的威力在于它帮助我们解决问题的程度。人工智能 (AI) 以及最近的生成式 AI 也不例