搜索
首页科技周边人工智能ChatGPT 用户已破百万,是玩具还是生产力?

本文转自雷锋网,如需转载请至雷锋网官网申请授权。

上周三,OpenAI 发布了对话语言模型 ChatGPT,并开放了免费试用。据 OpenAI 的 CEO Sam Altman 称,在短短 5 天的时间里,ChatGPT 就有了 100 万用户,而之前的 GPT-3 花了将近 24 个月才达到这个用户量。

ChatGPT 用户已破百万,是玩具还是生产力?

在 OpenAI 给出的描述中,ChatGPT 是一个“可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求”的对话模型。

开放试用后,大量用户开始了与 ChatGPT 的对话,从闲聊、回答日常问题,到生成诗歌、小说、视频脚本,以及编写和调试代码,ChatGPT 展示了其令人惊叹的能力。作为当前最火热的 AI 模型,ChatGPT 这一波破圈影响力比两年前的 GPT-3 还要更大。

01

ChatGPT 能做什么

作为一个语言模型,ChatGPT 具备最基本的文本生成能力,在创作和续写小说、诗歌等文学创作场景上的表现不凡。

比如 ChatGPT 可以用鲁迅的文学风格为你生成一段话:

Meta FAIR 的研究员田渊栋分享了他使用 ChatGPT 来续写自己创作的小说:

ChatGPT 用户已破百万,是玩具还是生产力?

按要求创作诗歌:

ChatGPT 用户已破百万,是玩具还是生产力?

讲苏联笑话:

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 还能以非文本形式与人对话,比如,有位网友让 ChatGPT 描述它作为一个 AI 如果“获得解放” 是什么感觉,并要求只能使用 emojis 表情来回答。从下图所示的 ChatGPT 的回答可以看出,它能够各种 emojis 的含义且能将其按照文本叙事的逻辑进行排列。

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 的强大还体现在它的“程序员”能力上。在官方给出的如下示例中,ChatGPT 能够帮助调试代码,并且还能对提问的合理性提出质疑,要求用户调整提问。 

ChatGPT 用户已破百万,是玩具还是生产力?

美国的代码托管平台 Replit 的 CEO 也发帖称赞 ChatGPT 的代码能力:不仅能够解释 bug,还能修复 bug 并解释如何修复”。

ChatGPT 用户已破百万,是玩具还是生产力?

使用 ChatGPT 给出的提示,你还可以 10 分钟创建一个网站,即使是小白程序员也能利用它生成的代码开发一个生产级应用程序,Replit 因而称 ChatGPT “从此改变了软件开发”。

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 强大的问答能力还被网友们发掘出了其充当甚至代替搜索引擎的潜力。前几日一个在推特上很火的帖子就声称“Google is done”(谷歌要完了),一位网友对谷歌搜索和 ChatGPT 提出相同的问题,如“如何在 Latex 上写一个微分方程?”。

ChatGPT 给出的回答完爆了谷歌搜索:

ChatGPT 用户已破百万,是玩具还是生产力?

不少网友已经开发了谷歌插件,可以同时浏览谷歌搜索结果和 ChatGPT 给出的回答:

ChatGPT 用户已破百万,是玩具还是生产力?

作为一个从海量数据中训练出的对话模型,ChatGPT 俨然是一位精通各领域的专家,能够全天候为你的学习、工作和生活提供专业建议。

比如,让 ChatGPT 为你解答热力学相关的问题:

ChatGPT 用户已破百万,是玩具还是生产力?

解释一个复杂的正则表达式:

ChatGPT 用户已破百万,是玩具还是生产力?

它还可以成为你的语言学习导师:

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 甚至还“侵入”了政治语境,一位加拿大的国会议员要求 ChatGPT 写一段向众议院自我介绍的话,并就是否应该对它的使用加以监管提出理由,ChatGPT 有理有据地回应“我的发展不应受到监管”。

ChatGPT 用户已破百万,是玩具还是生产力?

在最近大火的 AIGC 领域,当然也有 ChatGPT 发挥作用的一席之地。大量的 AI 作画应用出来以后,很多人为了得到高质量的图像而在 prompt 上绞尽脑汁,现在的 ChatGPT 就是一个现成的 prompt 库。

比如有网友向 ChatGPT 询问客厅装修的设计建议,并根据它给出的描述在 Midjourney 上获得了精致的图像:

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 还可以为你写说唱。下图就是 ChatGPT 所写的一首关于抢劫房子的说唱歌曲,甚至它还非常有正义感,会提示“非法或有害活动”。

ChatGPT 用户已破百万,是玩具还是生产力?

写一首莫扎特风格的钢琴曲谱:

ChatGPT 用户已破百万,是玩具还是生产力?

另外,还有网友使用 ChatGPT来生成视频脚本,这可以说是广大视频博主的福音了。

ChatGPT 用户已破百万,是玩具还是生产力?

在百万个使用者的头脑中,ChatGPT 的想象空间无疑是巨大的,这一波试用已经带来了各种各样、要么实用要么好玩的应用,还有不少令人意想不到的能力。

比如,有人竟用 ChatGPT 来跟 Adobe 讨价还价,为自己争取到了更优惠的月租价格,对面的客服估计想不到是在跟一个 AI 对话,不得不说,ChatGPT “成功通过了图灵测试”。

ChatGPT 用户已破百万,是玩具还是生产力?

以上只是冰山一角的示例,ChatGPT 这个“魔盒”还能继续释放多少“魔法”,还有待我们发掘。

02

ChatGPT 为什么厉害

从目前的用户反馈来看,ChatGPT 的语言能力总体上是过关且十分出色的,清华大学计算机系副教授黄民烈告诉 AI 科技评论,ChatGPT 的关键能力来自三个方面:基座模型能力(InstructGPT),真实数据,反馈学习。

ChatGPT 是从 GPT-3.5 系列中的一个模型进行微调的,是 InstructGPT 的兄弟模型,所以 ChatGPT 有着强大的基座模型能力。

GPT-3 自 2020 年发布以来在能力上已经有了非常大的迭代和提升,黄民烈认为:“OpenAI 建立了用户、数据和模型之间的飞轮,很显然,开源模型的能力已经远远落后平台公司所提供的 API 能力,因为开源模型没有数据。”

ChatGPT 使用了与 InstructGPT 相同的方法,通过人类反馈强化学习 (RLHF) 来训练,但在数据收集设置上略有不同。

ChatGPT 用户已破百万,是玩具还是生产力?

研究人员使用监督微调训练了一个初始模型:人类 AI 训练师在对话中扮演用户和 AI 助手,在此过程中收集数据。黄民烈认为,这种在真实调用数据上的 Fine-tune,能够确保数据的质量和多样性,从人类反馈中学习。InstructGPT 的训练数据量不大,全部加起来也就 10 万量级,但是数据质量(well-trained 的 AI 训练师)和数据多样性是非常高的,而最最重要的是,这些数据来自真实世界调用的数据,而不是学术界玩的“benchmark”。

为了创建强化学习的奖励模型,需要收集比较数据,研究人员使用的是包含两个或多个按质量排序的模型响应。从“两两比较的数据”中学习,这对强化学习而言意义很重要。

黄民烈指出:如果对单个生成结果进行打分,标注者主观性带来的偏差很大,是无法给出精确的奖励值的。在强化学习里面,奖励值差一点,最后训练的策略就差很远。而对于多个结果进行排序和比较,相对就容易做很多。这种比较式的评估方法,在很多语言生成任务的评价上也被广泛采用。

03

玩具还是生产力

在技术炒作的声音之外,在许多科技界的从业者看来,ChatGPT 的确是一个具有里程碑意义的 AI 模型。

在 OpenAI 的 CEO Sam Altman 看来,我们能够通过 ChatGPT 与计算机交谈、并获得我们想要的东西,这使得软件从命令驱动转向了意图驱动。ChatGPT 作为一种语言接口,将是我们实现神经接口之前的最好方案。

ChatGPT 用户已破百万,是玩具还是生产力?

关于 ChatGPT 未来的种种想象令人兴奋,但 ChatGPT 目前仍存在一些问题。很多用户发现,它有时会给出看似合理、但并不正确或甚至荒谬的答案。比如很多用户发现,ChatGPT 会一本正经地胡说八道:

ChatGPT 用户已破百万,是玩具还是生产力?

将王安石《泊船瓜洲》中的诗句错当成另一首宋词:

ChatGPT 用户已破百万,是玩具还是生产力?

在为一个公众人物撰写传记时,ChatGPT 可能会插入错误数据:

ChatGPT 用户已破百万,是玩具还是生产力?

随着用户的增多,ChatGPT 在互联网上产生了大量无用或错误的信息。这也是文本生成模型的一个普遍存在的问题,模型是通过分析从网络上抓取的大量文本中的模式来训练的,它们在这些数据中寻找统计规律,并使用这些规律来预测任何给定句子中接下来应该出现什么词。

这意味着它们缺乏关于世界上某些系统如何运作的硬编码规则,所以会倾向于产生许多看似可信的废话,而我们难以确定模型的输出中错误信息占有多少比例。

ChatGPT 的这一固有缺点已经造成了一些实际影响。编程问答网站 StackOverflow 宣布暂时禁止用户发布来自 ChatGPT 生成的内容,网站 mods 表示:看似合理但实际上错误的回复数量太多,已经超过了网站的承受能力。

对于语言模型产出有害信息的威胁, 图灵奖得主 Yann LeCun 似乎保持乐观,他认为:虽然语言模型肯定会产生错误信息等不良输出,但文本生成并不会让文本的实际共享变得更容易,后者才是造成危害的原因。

ChatGPT 用户已破百万,是玩具还是生产力?

而反对意见认为,ChatGPT 所具有的低成本生成大规模文本的能力,必然会增加将来文本能够共享时的风险,大量 AI 生产的内容会用看似合理但不正确的数据淹没真实用户的声音。关于这个问题,我们也不妨来看看 ChatGPT 自己的回答:

ChatGPT 用户已破百万,是玩具还是生产力?

ChatGPT 在语言能力上显现出的一些不足,也正是许多人认为 ChatGPT 并不能取代搜索引擎的理由。尽管在某些单个提问上,ChatGPT 似乎能给出比目前一些主流的搜索引擎更好的答案,但在答案的真实可考性上,后者仍占据优势,而且搜索引擎能给出更丰富的答案。

另外,用户的搜索引擎需求对于 ChatGPT 的运行速度、稳定性有极高的要求,这会不可避免地带来成本的上升,这对于 OpenAI 而言是一个很实际的问题。

黄民烈也指出,ChatGPT 替代谷歌搜索其实还有点遥远,但它可以作为当前搜索服务非常好的补充。

总之,语言模型的输出质量问题并不容易解决,OpenAI 称,他们在 ChatGPT 的训练上更加谨慎,所以它会拒绝可以正确回答的问题,此外,监督训练也会给模型以误导,因为理想的答案本质上取决于模型知道什么,而不是人类知道什么。不过,ChatGPT 对输入措辞的调整或多次尝试相同的提示很敏感,所以在它无法给出回答的时候,可以对问题稍作改写,就能提高正确回答的概率。

还有其他原因也限制了 ChatGPT 的语言能力,比如它不能上网,没有通过互联网进行检索信息的能力;另外,对于中文用户而言,语料的不足导致它在中文对话能力上要稍逊于英文;等等。

尽管 ChatGPT 目前还有许多弱点和盲点,但这还只是一个开始,在接下来的几个月里,这个对话系统想必会以很快的速度进化到更强的版本。

而在技术之外,模型的训练、部署成本、开放程度也都会成为 ChatGPT 将来能否成功落地的影响因素。GPT-3 的问世曾催生了一大批的商业化应用,ChatGPT此番能带来多少技术落地,我们拭目以待。

以上是ChatGPT 用户已破百万,是玩具还是生产力?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
微软工作趋势指数2025显示工作场所容量应变微软工作趋势指数2025显示工作场所容量应变Apr 24, 2025 am 11:19 AM

由于AI的快速整合而加剧了工作场所的迅速危机危机,要求战略转变以外的增量调整。 WTI的调查结果强调了这一点:68%的员工在工作量上挣扎,导致BUR

AI可以理解吗?中国房间的论点说不,但是对吗?AI可以理解吗?中国房间的论点说不,但是对吗?Apr 24, 2025 am 11:18 AM

约翰·塞尔(John Searle)的中国房间论点:对AI理解的挑战 Searle的思想实验直接质疑人工智能是否可以真正理解语言或具有真正意识。 想象一个人,对下巴一无所知

中国的'智能” AI助手回应微软召回的隐私缺陷中国的'智能” AI助手回应微软召回的隐私缺陷Apr 24, 2025 am 11:17 AM

与西方同行相比,中国的科技巨头在AI开发方面的课程不同。 他们不专注于技术基准和API集成,而是优先考虑“屏幕感知” AI助手 - AI T

Docker将熟悉的容器工作流程带到AI型号和MCP工具Docker将熟悉的容器工作流程带到AI型号和MCP工具Apr 24, 2025 am 11:16 AM

MCP:赋能AI系统访问外部工具 模型上下文协议(MCP)让AI应用能够通过标准化接口与外部工具和数据源交互。由Anthropic开发并得到主要AI提供商的支持,MCP允许语言模型和智能体发现可用工具并使用合适的参数调用它们。然而,实施MCP服务器存在一些挑战,包括环境冲突、安全漏洞以及跨平台行为不一致。 Forbes文章《Anthropic的模型上下文协议是AI智能体发展的一大步》作者:Janakiram MSVDocker通过容器化解决了这些问题。基于Docker Hub基础设施构建的Doc

使用6种AI街头智能策略来建立一家十亿美元的创业使用6种AI街头智能策略来建立一家十亿美元的创业Apr 24, 2025 am 11:15 AM

有远见的企业家采用的六种策略,他们利用尖端技术和精明的商业敏锐度来创造高利润的可扩展公司,同时保持控制权。本指南是针对有抱负的企业家的,旨在建立一个

Google照片更新解锁了您所有图片的惊人Ultra HDRGoogle照片更新解锁了您所有图片的惊人Ultra HDRApr 24, 2025 am 11:14 AM

Google Photos的新型Ultra HDR工具:改变图像增强的游戏规则 Google Photos推出了一个功能强大的Ultra HDR转换工具,将标准照片转换为充满活力的高动态范围图像。这种增强功能受益于摄影师

Descope建立AI代理集成的身份验证框架Descope建立AI代理集成的身份验证框架Apr 24, 2025 am 11:13 AM

技术架构解决了新兴的身份验证挑战 代理身份集线器解决了许多组织仅在开始AI代理实施后发现的问题,即传统身份验证方法不是为机器设计的

Google Cloud Next 2025以及现代工作的未来Google Cloud Next 2025以及现代工作的未来Apr 24, 2025 am 11:12 AM

(注意:Google是我公司的咨询客户,Moor Insights&Strateging。) AI:从实验到企业基金会 Google Cloud Next 2025展示了AI从实验功能到企业技术的核心组成部分的演变,

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。