搜索
首页科技周边人工智能GPT-4比ChatGPT有何进步?黄仁勋与OpenAI联合创始人进行了一次“炉边谈话”

ChatGPT与GPT-4之间最重要的区别在于在GPT-4的基础上构建预测下一个字符具有更高的准确度。神经网络越能预测文本中的下一个词,它就越能理解文本。

大数据文摘出品

作者:Caleb

英伟达碰上OpenAI会擦出怎样的火花?

就在刚刚,英伟达创始人兼首席执行官黄仁勋在GTC的炉边谈话中与OpenAI共同创办人Ilya Sutskever进行了一次深入交流。

图片

视频链接:

​​https://www.nvidia.cn/gtc-global/session-catalog/?tab.catalogallsessinotallow=16566177511100015Kus#/session/1669748941314001t6Nv​​

前两天,OpenAI推出了迄今为止最强大的人工智能模型GPT-4。OpenAI在官网上称GPT-4是“OpenAI最先进的系统”,“能够产生更安全、更有用的响应”。

Sutskever在谈话中也表示,与ChatGPT相比,GPT-4在许多方面标志着“相当大的改进”,并指出新模型可以读取图像和文本。他说,“在未来的某个版本中,[用户]可能会得到一张图表”以回应提问和查询。

毫无疑问,随着ChatGPT与GPT-4在全球范围内的爆火,这也成为了这次谈话的关注焦点,而除了GPT-4及其前身包括ChatGPT相关话题外,黄仁勋与Sutskever也聊到了深度神经网络的能力、局限性和内部运作方式,以及对未来AI发展的预测。

接下来就和文摘菌一起深入这场对话看看吧~

从网络规模和计算规模还无人在意时做起

可能不少人一听到Sutskever的名字最先想到的就是OpenAI及其相关的AI产品,但要知道,Sutskever的履历可以追溯到吴恩达的博士后、Google Brain的研究科学家,以及Seq2Seq模型的合作开发者。

可以说,从一开始,深度学习就与Sutskever绑定在了一起。

在谈及对深度学习的认识时,Sutskever表示,从现在来看,深度学习确实改变了世界。不过他个人的出发点更多是在于对AI存在的巨大影响潜力的直觉,对意识与人类体验的浓厚兴趣,以及认为AI的发展会帮助解答这些问题。

2002-03年期间,人们普遍认为学习是一件只有人类才能做到的事,计算机是无法学习的。而如果能让计算机具有学习的能力,那将是AI领域一次重大的突破。

这也成了Sutskever正式进军AI领域的契机。

于是Sutskever找到了同一所大学的Jeff Hinton。在他看来,Hinton所从事的神经网络正是突破口,因为神经网络的特性就在于能够学习,可以自动编程的并行计算机。

而彼时并没有人在意网络规模和计算规模的重要性,人们训练的神经网络只有50个或100个,数百个的规模已经算大的了,一百万的参数也被视为很庞大。

除此之外,他们还只能在没有优化过的CPU代码上跑程序,因为没人懂BLAS,多用优化后的Matlab做一些实验,比如用什么样的问题来提问比较好。

但问题是,这些都是很零散的实验,无法真正推动技术进步。

构建面向计算机视觉的神经网络

当时,Sutskever就察觉到,有监督学习才是未来前进的方向。

这不仅是一种直觉,也是无需争辩的事实。在神经网络足够深且足够大的基础上,那么它就有能力去解决一些有难度的任务。但人们还没有专注在深且大的神经网络上,甚至人们根本没有把目光放在神经网络上。

为了找到一个好的解决方案,就需要一个合适的大数据集以及大量的计算。

ImageNet就是那个数据。当时ImageNet是一个难度很高的数据集,但要训练一个大的卷积神经网络,就必须要有匹配的算力。

接下来GPU就该出场了。在Jeff Hinton的建议下,他们发现随着ImageNet数据集的出现,卷积神经网络是非常适合GPU的模型,所以能够让它变得很快,规模也就这么越来越大了。

随后更是直接大幅打破了计算机视觉的纪录,而这不是基于以往方法的延续,关键是在于这个数据集本身的难度与范围。

OpenAI:从100人到ChatGPT

在OpenAI初期,Sutskever坦言道,他们也不是完全清楚如何推动这个项目。

在2016年初,神经网络没有那么发达,研究人员也比现在少很多。Sutskever回忆称,当时公司只有100个人,大部分还都在谷歌或deepmind工作。

不过当时他们有两个大的思路。

其中一个是通过压缩进行无监督学习。2016年,无监督学习是机器学习中一个尚未解决的问题,没有人知道怎么实现。最近,压缩也并不是人们通常会谈到的话题,只是突然间大家突然意识到GPT实际上压缩了训练数据。

从数学意义上讲,训练这些自回归生成模型可以压缩数据,并且直观上也可以看到为什么会起作用。如果数据被压缩得足够好,你就能提取其中存在的所有隐藏信息。这也直接导致了OpenAI对情绪神经元的相关研究。

同时,他们对相同的LSTM进行调整来预测亚马逊评论的下一个字符时发现,如果你预测下一个字符足够好,就会有一个神经元在LSTM内对应于它的情绪。这就很好地展示了无监督学习的效果,也验证了下一个字符预测的想法。

但是要从哪里得到无监督学习的数据呢?Sutskever表示,无监督学习的苦难之处不在于数据,更多关于为什么要这么做,以及意识到训练神经网络来预测下一个字符是值得追求和探索的。于此它会学习到一个可以理解的表征。

另一个大的思路就是强化学习。Sutskever一直相信,更大的就是更好的(bigger is better)。在OpenAI,他们的一个目标就是找出规模扩展的正确途径。

OpenAI完成的第一个真正的大型项目是实施战略游戏Dota 2。当时OpenAI训练了一个强化学习的agent来与自己对抗,目标是达到一定水平能够和人类玩家游戏。

从Dota的强化学习转变为人类反馈的强化学习与GPT产出技术基座结合,就成了如今的ChatGPT。

OpenAI是如何训练一个大型神经网络的

当训练一个大型神经网络来准确预测互联网上不同文本中的下一个词的时候,OpenAI所做的是学习一个世界模型。

这看上去像是只在学习文本中的统计相关性,但实际上,学习这些统计相关性就可以把这些知识压缩得非常好。神经网络所学习的是生成文本的过程中的一些表述,这个文本实际上是世界的一个映射,因此神经网络便能够学习越来越多的角度来看待人类和社会。这些才是神经网络真正在准确预测下一个词的任务中学习到的东西。

同时,对下一个词的预测越准确,还原度就越高,在这个过程中得到的对世界的分辨率就越高。这是预训练阶段的作用,但这并不能让神经网络表现出我们希望它表现出的行为。

一个语言模型真正要做到的是,如果我在互联网上有一些随机文本,以一些前缀或提示开始,它会补全什么内容。

当然它也可以在互联网上找到文本进行填充,但这就不是最初构想的那样的,因此还需要额外的训练,这就是微调、来自人类老师的强化学习,以及其他形式的AI协助可以发挥作用的地方。

但这不是教授新的知识,而是与它交流,向它传达我们希望它变成什么样,其中也包括了边界。这个过程做得越好,神经网络就越有用越可靠,边界的保真度也就越高。

再谈GPT-4

ChatGPT成为用户增长最快的应用没多久,GPT-4就正式释出。

在谈到两者的区别时,Sutskever表示,GPT-4相较于ChatGPT在许多维度上都做到了相当大的改进。

ChatGPT与GPT-4之间最重要的区别在于在GPT-4的基础上构建预测下一个字符具有更高的准确度。神经网络越能预测文本中的下一个词,它就越能理解文本。

比如,你读了一本侦探小说,情节非常复杂,穿插了非常多的故事情节和人物,埋了很多神秘的线索。在书的最后一章,侦探收集了所有的线索,召集了所有人,说现在他将揭示谁是犯人,那个人就是……

这就是GPT-4能够预测的东西。

人们都说,深度学习不会逻辑推理。但不管是这个例子还是GPT能做到的一些事,都展现出了一定程度的推理能力。

Sutskever对此回应称,当我们在定义逻辑推理时,在进行下一步决策时如果你能够以某种方式思考一下或许能得到一个更好的答案。而神经网络能走多远也尚待考察,OpenAI目前还没有充分挖掘出它的潜力。

一些神经网络其实已经具备了这类能力,但是大多都还不够可靠。而可靠性是让这些模型有用的最大阻碍,这也是当前模型的一大瓶颈。这不关乎模型是否具备特定的能力,而是具备多少能力。

Sutskever也表示,GPT-4发布时并没有内置的检索功能,它只是一个能够预测下一个词的很好的工具,但可以说它完全具备这个能力,将检索变得更好。

GPT-4还有一个显著的改进就是对图像的响应和处理。多模态学习在其中发挥了重要的作用,Sutskever说到,多模态有两个维度,第一个在于多模态对神经网络是有用处的,尤其是视觉;第二个在于除了文本学习外,从图像中也可以学习到世界的知识。

人工智能的未来

再说到利用AI训练AI时,Sutskever表示这一部分的数据不应该被忽视。

预测未来语言模型的发展是一件困难的事,但是在Sutskever看来,有充分理由相信这个领域会持续进步,AI也将在自己的能力边界继续用实力震惊人类。AI的可靠性是由是否可以被信任决定的,未来肯定会达到可被完全信赖的地步。

如果它不能完全理解,它也会通过提问来弄清楚,或者告诉你它不知道,这些正是AI可用性影响最大的领域,未来会有最大的进步。

现在就面临这样一个挑战,你想让一个神经网络总结长文档或获取摘要,如何确定重要的细节没有被忽视?如果一个要点显然重要到每个读者都会对此达成一致,那么就可以承认神经网络总结的内容是可靠的。

在神经网络是否清楚地遵循用户意图这一点上也同样适用。

未来两年会看到越来越多这样的技术,让这项技术变得越来越可靠。

相关报道:​​https://blogs.nvidia.com/blog/2023/03/22/sutskever-openai-gtc/​​

以上是GPT-4比ChatGPT有何进步?黄仁勋与OpenAI联合创始人进行了一次“炉边谈话”的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51cto。如有侵权,请联系admin@php.cn删除
易于理解的解释如何保存对话历史记录(对话日志)!易于理解的解释如何保存对话历史记录(对话日志)!May 16, 2025 am 05:41 AM

高效保存ChatGPT对话记录的多种方法 您是否曾想过保存ChatGPT生成的对话记录?本文将详细介绍多种保存方法,包括官方功能、Chrome扩展程序和截图等,助您充分利用ChatGPT对话记录。 了解各种方法的特点和步骤,选择最适合您的方式。 [OpenAI最新发布的AI代理“OpenAI Operator”介绍](此处应插入OpenAI Operator的链接) 目录 使用ChatGPT导出功能保存对话记录 官方导出功能的使用步骤 使用Chrome扩展程序保存ChatGPT日志 ChatGP

使用Chatgpt创建时间表!解释可用于创建和调整表的提示使用Chatgpt创建时间表!解释可用于创建和调整表的提示May 16, 2025 am 05:40 AM

现代社会节奏紧凑,高效的日程管理至关重要。工作、生活、学习等任务交织在一起,优先级排序和日程安排常常让人头疼不已。 因此,利用AI技术的智能日程管理方法备受关注。特别是利用ChatGPT强大的自然语言处理能力,可以自动化繁琐的日程安排和任务管理,显着提高生产力。 本文将深入讲解如何利用ChatGPT进行日程管理。我们将结合具体的案例和步骤,展示AI如何提升日常生活和工作效率。 此外,我们还会讨论使用ChatGPT时需要注意的事项,确保安全有效地利用这项技术。 立即体验ChatGPT,让您的日程

如何将chatgpt与电子表格连接!对您可以做什么的详尽解释如何将chatgpt与电子表格连接!对您可以做什么的详尽解释May 16, 2025 am 05:39 AM

我们将解释如何将Google表和Chatgpt联系起来,以提高业务效率。在本文中,我们将详细解释如何使用易于使用的“床单和文档的GPT”附加组件。无需编程知识。 通过CHATGPT和电子表格集成提高业务效率 本文将重点介绍如何使用附加组件将Chatgpt与电子表格连接。附加组件使您可以轻松地将ChatGpt功能集成到电子表格中。 gpt for shee

6个投资者对AI的预测于2025年6个投资者对AI的预测于2025年May 16, 2025 am 05:37 AM

专家们预测AI革命的未来几年,专家们预测专家们都在强调了总体趋势和模式。例如,对数据的需求很大,我们将在后面讨论。此外,对能量的需求是D

使用chatgpt进行写作!提示的提示和示例的详尽说明!使用chatgpt进行写作!提示的提示和示例的详尽说明!May 16, 2025 am 05:36 AM

Chatgpt不仅是文本生成工具,而且是一个真正的合作伙伴,可显着提高作家的创造力。通过在整个写作过程中使用chatgpt,例如初始手稿创建,构思想法和风格变化,您可以同时节省时间并提高质量。本文将详细说明在每个阶段使用Chatgpt的特定方法,以及最大化生产力和创造力的技巧。此外,我们将研究将Chatgpt与语法检查工具和SEO优化工具相结合的协同作用。通过与AI的合作,作家可以通过免费想法创造独创性

如何在chatgpt中创建图形!无需插件,因此也可以用于Excel!如何在chatgpt中创建图形!无需插件,因此也可以用于Excel!May 16, 2025 am 05:35 AM

使用chatgpt的数据可视化:从图创建到数据分析 数据可视化以易于理解的方式传达复杂信息,在现代社会中至关重要。近年来,由于AI技术的进步,使用Chatgpt的图形创建引起了人们的关注。在本文中,我们将解释如何以易于理解的方式使用Chatgpt创建图形,甚至对于初学者。我们将介绍免费版本和付费版本(Chatgpt Plus),特定创建步骤以及如何显示日语标签以及实际示例之间的差异。 使用chatgpt创建图形:从基础到高级使用 chatg

用餐盘推动现代LLM的极限?用餐盘推动现代LLM的极限?May 16, 2025 am 05:34 AM

通常,我们知道AI很大,而且越来越大。快速,越来越快。 但是,具体来说,并不是每个人都熟悉行业中一些最新的硬件和软件方法,以及它们如何促进更好的结果。人民

归档您的Chatgpt对话历史!解释保存的步骤以及如何还原归档您的Chatgpt对话历史!解释保存的步骤以及如何还原May 16, 2025 am 05:33 AM

ChatGPT对话记录管理指南:高效整理,充分利用你的知识宝库! ChatGPT对话记录是创意和知识的源泉,但不断增长的记录如何有效管理呢? 查找重要信息耗时费力?别担心!本文将详细讲解如何有效“归档”(保存和管理)你的ChatGPT对话记录。我们将涵盖官方归档功能、数据导出、共享链接以及数据利用和注意事项。 目录 ChatGPT的“归档”功能详解 ChatGPT归档功能使用方法 ChatGPT归档记录的保存位置和查看方法 ChatGPT归档记录的取消和删除方法 取消归档 删除归档 总结 Ch

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。