搜索
首页科技周边人工智能GPT-4的两个谣言和最新预测!

GPT-4的两个谣言和最新预测!

Apr 11, 2023 pm 06:07 PM
apigpt-4模型

​作者 | 云昭

3月9日,微软德国CTO Andreas Braun在AI kickoff会议上带来了一个期待已久的消息:“我们将于下周推出GPT-4,届时我们将推出多模式模式,提供完全不同的可能性——例如视频。”

图片

言语之中,他将大型语言模型(LLM)比作“游戏改变者”,因为他们教机器理解自然语言,然后机器以统计的方式理解以前只能由人类阅读和理解的东西。与此同时,这项技术已经发展到“适用于所有语言”:你可以用德语提问,也可以用意大利语回答。借助多模态,微软(-OpenAI)将“使模型变得全面”。

那么看来,GPT-4将是一个多模态大模型基本可以确定无疑了。但如果想提前知道有关GPT-4的真面目,并非无迹可寻。

一、预测:GPT-4基于此前多模态大语言模型Kosmos-1

其实早在3月1日,我们注意到微软就发表了多模态的大语言模型Kosmos-1。如果GPT-4是多模态的,我们可以合理地预测GPT-4能够做什么。

图片

KOSMOS-1是一种多模态大型语言模型(MLLM),能够感知多模态输入,遵循指令,并执行上下文学习任务,也可以是多模态任务。在这项工作中,将视觉与大型语言模型(LLM)对齐,推动了从LLM向MLLM的演进。

图片

斯坦福博士、英伟达AI科学家Jim Fan基于此做出了5点具体的预测:

(1)视觉智商测试:是的,人类参加的测试!(2)无OCR阅读理解:输入屏幕截图、扫描文档、路牌或任何包含文本的像素。直接对内容进行推理,无需显式OCR。这对于解锁多媒体网页上的AI驱动的应用程序或来自现实世界摄像头的“野外文本”非常有用。(3)多模态聊天:就图片进行对话。你甚至可以在中途提供“后续”图片。(4)广泛的视觉理解能力,如字幕、视觉问答、物体检测、场景布局、常识推理等。(5)音频和语音识别:在Kosmos-1论文中没有提到,但Whisper已经是一个OpenAI API,应该很容易集成。  

图片

Jim认为基于Andreas最近宣布的内容做出的预测,可能有些出入。但 Kosmos-1已经做到这些了。有理由相信,它提供了GPT-4或微软接下来将提供的任何人工智能服务的能力。“很难相信Kosmos-1会留在实验室,而不成为产品”。

图片

多模态大模型应用示例:图像捕捉、图像问答、OCR、可视化对话

Jim建议从业者,“请为多模态API做好准备——它们迟早会出现!”

二、GPT-4会成为AGI?远远不够

首先,准确度的问题仍然不够。当被问及操作可靠性和事实保真度时,微软德国高级人工智能专家Siebler表示AI不会总是正确回答,因此有必要进行验证。微软目前正在创建置信度指标来解决此问题。客户通常仅在自己的数据集上使用AI支持,主要用于阅读理解和查询库存数据,其中模型已经相当准确然而,模型生成的文本仍然是生成性的,因此不容易验证。Siebler说:“我们围绕它建立了一个反馈循环,包括赞成和反对。”这是一个迭代过程。

其次,数据不够。即便多模态的GPT-4即将展现出强大的视觉、听觉、阅读理解和推理能力,但这仅仅是AGI的冰山一角,以类人机器人为例,机器人的控制数据很难做到统一,而且,这些控制数据与机器人硬件有关,差异很大。因此,无法轻松组合来自不同真实机器人的训练数据,与文本、视频、图像、音频等数据有着质的不同。

三、GPT-4的两个谣言

1.百万亿参数?假的!

GPT-4是OpenAI正在创建的一种新的语言模型,它可以生成类似于人类语音的文本。它将推进基于GPT-3.5的ChatGPT所使用的技术。

早在2021年8月,行业专家就推测GPT-4将具有100万亿个参数,但当时就有人表示:用更多参数构建AI并不一定能保证更好的性能,并且可能影响响应性。

图片

但ChatGPT之父Altman很快就辟谣了:ChatGPT的下一个版本不会是AGI,也不会有100万亿个参数。那些谣言是不正确的。

2.Bing聊天是否使用GPT-4?

微软曾表示,新的Bing或Bing Chat比ChatGPT更强大。由于OpenAI的聊天使用GPT-3.5,因此有人推测,Bing聊天可能使用GPT-4。这一点尚未得到证实。

很明显,Bing Chat已经升级,可以通过互联网访问当前信息,这是对ChatGPT的一个巨大改进,在此之前,它只能从2021之前接受的训练数据中受益。

除了互联网的接入,用于Bing聊天的AI模型要快得多,这在从实验室取出并添加到搜索引擎中时非常重要。

但这似乎不太可能等同于OpenAI的GPT-4模型。如果GPT-4已经公开可用,则无需再秘而不宣了。

四、GPT-4:一种进化,而不是革命

毫无疑问,即将到来的GPT-4,肯定会给人留下深刻印象,但OpenAI首席执行官Sam·Altman在StrictlyVC采访中表示,“人们正在‘乞求’失望,他们会失望的。”

Altman之前还曾在推特上表示:AGI对世界经济造成巨大破坏的潜力,并表示,快速推出几项小变化,总比令人震惊的进步要好,因为它几乎没有为世界提供适应变化的机会。

无独有偶,世界级人工智能大神Ben Goertzel也给GPT-3/GPT-4泼了不少冷水:

当然,现在人们应该注意到,投入这些“知识重新排列”系统(如 ChatGPT)的美元和人力的数量远远大于投入替代人工智能方法的数量,这些方法更多地尊重扎根的、自我修正的认知的复杂性。

1970年代末 - 90年代初对多层神经网络的全面怀疑和对专家系统的拥护看起来天真、陈旧和愚蠢,像极了现在的样子。

同样,到2020年代中期/后期,今天对LLM满怀幻想的热情和对更微妙的 AGI 方法的油嘴滑舌的驳斥将看起来太荒谬了

我在这个帖子中的观点,并不是说这些基于LLM的系统不酷或无用——只是它们是一种时髦的新型窄人工智能技术,它与AGI的联系并不像它出现在表面上,或者正如一些评论者所声称的那样。

简而言之,GPT-4将是一场进化,而不是一场革命。

五、写在最后

很明显,ChatGPT 4不太可能成为OpenAI下一个产品的名称,但会带来一些创造性的想象,ChatGPT的名字,极有可能与驱动其改进的AI模型GPT-4结合起来。AI从业者及管理者需要重点关注GPT-4、ChatGPT目前的工作进展,以及OpenAI何时可能发布下一次重大升级。

最后,想对大家说,下周发布GPT-4是否符合本文的预测并不重要,包括我们期待的国产大模型“文心一言”也是如此。重要的是,开发者或者所在的企业是否已经做好准备来迎接多模态大模型的API。何其有幸,这些都有希望在2024之前到来!

参考链接:

https://arxiv.org/abs/2302.14045

https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html

https://t.co/JbtQvjoJ3W

以上是GPT-4的两个谣言和最新预测!的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
阅读AI索引2025:AI是您的朋友,敌人还是副驾驶?阅读AI索引2025:AI是您的朋友,敌人还是副驾驶?Apr 11, 2025 pm 12:13 PM

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

开始使用Meta Llama 3.2 -Analytics Vidhya开始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

AV字节:Meta' llama 3.2,Google的双子座1.5等AV字节:Meta' llama 3.2,Google的双子座1.5等Apr 11, 2025 pm 12:01 PM

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

与机器交谈的人类成本:聊天机器人真的可以在乎吗?与机器交谈的人类成本:聊天机器人真的可以在乎吗?Apr 11, 2025 pm 12:00 PM

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

了解Python的Scipy图书馆了解Python的Scipy图书馆Apr 11, 2025 am 11:57 AM

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

3种运行Llama 3.2的方法-Analytics Vidhya3种运行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

使用dagster自动化数据质量检查使用dagster自动化数据质量检查Apr 11, 2025 am 11:44 AM

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机在人工智能时代有角色吗?大型机在人工智能时代有角色吗?Apr 11, 2025 am 11:42 AM

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境