重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？-人工智能-PHP中文网

首页

科技周边

人工智能

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 18, 2023 pm 03:29 PM

ai开源

就在刚刚，根据The Information的最新爆料，OpenAI即将发布一款全新的开源大语言模型。

虽然目前还不清楚，OpenAI是不是打算利用即将开源的模型，来抢占Vicuna或其他开源模型的市场份额。

但几乎可以肯定的是，新模型的能力大概率无法与GPT-4甚至GPT-3.5相竞争。

毕竟，270亿美元的估值也决定了，OpenAI最先进的模型将会被用于商业目的，尽管前两个版本的GPT都是开源的。

对此，OpenAI的发言人没有回应置评请求。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

羊驼家族开源大爆发

十天前，谷歌的一份内部文件泄漏。在这篇名为《我们没有护城河，OpenAI也没有》的文章里，作者沉痛控诉了开源对于谷歌和OpenAI的沉重打击。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

的确，在这次军备竞赛中，谷歌和OpenAI似乎都不是赢家，因为开源社区正在吃掉属于它们的「利益」。

ChatGPT一出，引爆了全球的LLM革命。然而，OpenAI不Open，很多公司和开发者只能看着干着急。

此时，Meta站出来发布了LLaMA，为全世界开发者谋了一把福利。

本来呢，Meta承诺的是LLaMA会对非商用的研究用例开源，可是谁能想到，仅在发布一周后，LLaMA的权重忽然在4chan上泄漏了，瞬间就引发了数千次下载。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

这场「史诗级泄漏」，直接让开源LLM领域变了天。短短几周内，各种ChatGPT平替就以迅雷不及掩耳之势呈爆炸式增长。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat……简直堪称是「羊驼家族」大爆炸。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

其实，早在羊驼之前，开源模型就曾破灭过OpenAI的野心。

当时，刚刚发布的Dall-E 2凭借着惊艳的文生图效果，在网上引起了不小的轰动。

然而，当OpenAI还在试图兜售API时，一款开源替代突然横空出世——Stable Diffusion。

随着Stable Diffusion的迅速崛起，Dall-E 2也很快就被开发者们抛在了脑后。

开源大模型，要颠覆硅谷大厂？

UC Berkeley的计算机教授Ion Stoica正是使用Meta的研究开发Vicuna的学者之一。

为了提高Vicuna的能力，Stoica和同事们正在努力增加模型中的计算数量，这将有助于处理涉及推理的任务，比如写代码。

开发Vicuna的是一个伯克利的团队，每年的预算为数百万美元，其中大约50万美元来自包括微软、谷歌和亚马逊在内的上市公司。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

UC Berkeley的计算机教授Ion Stoica表示，现在的免费AI模型，在性能上已经「相当接近」谷歌和OpenAI的专有模型了，毫无疑问，大多数开发者最终都会选择免费模型。

一方面，开源模型可以让开发者使用自己的数据来解决特定的问题。

另一方面，像Vicuna这种模型的训练成本甚至可以低至几百美元，而且还不用向大厂支付昂贵的使用费。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

https://www.php.cn/link/4d8bd3f7351f4fee76ba17594f070ddd

如果Stoica的看法正确，开源AI必将颠覆谷歌、OpenAI、微软等出售专有模型使用权的大厂的商业计划。

Vicuna的质量和开源AI的寒武纪大爆发，让谷歌工程师Luke Sernau警告同事，谷歌在努力追赶OpenAI时，太过关注专有软件了。

如果免费、高质量的平替没有使用限制，谁会去付费使用带有条条框框的谷歌产品呢？开源AI的发展正在超越我们，谷歌应该在开源社区中建立自己的领导地位，并放弃对我们模型的部分控制。

这份备忘录迅速在整个行业内引起了共鸣——即使Sernau或许高估了开源AI的能力，低估了它们的成本和风险，但大多数从业者都同意，Meta非常有可能从中获益。

比如，Meta在内部会使用AI模型进行内容推荐和广告定位，当开发者改进Meta的模型时，Meta就可以把这些改进纳入自己内部的AI。

Meta CEO小扎对此筹谋已久。

4月，在他与分析师的一次电话会议中，他曾这样谈到公司的策略——

如果行业能够在我们使用的基础工具上达成标准化，那么我们就能从其他人的改进中受益，这样会更好。

谷歌倒是没有完全采用专有的方式来处理AI软件。

早在2020年，谷歌就发布了一个开源语言模型T5，让开发者可以构建能够执行翻译和摘要任务的软件。随后，谷歌又发布了一个更先进的Flan-T5。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

但是，根据Stoica和其他从业者的说法，Meta发布的软件能够在谷歌模型的基础上做出显著改进，这让开发者选择Meta模型的可能性大大增加了。

不过，Stoica表示，谷歌在开源软件方面仍有两个优势。

1. 如果谷歌利用其不向外部开放的用户数据，模型在某些专业领域（如内容推荐）的表现可能会更好。

不过，谷歌发言人表示，公司并没有在现有用户数据上训练其基础模型。

2. 搜索公司在管理大规模计算机基础设施方面的专长，意味着它能够以更低的成本来运行模型，包括为云客户提供服务。

与此同时，OpenAI在收集数百万人与ChatGPT互动方式的数据上，已经抢得了先机，这会更有助于OpenAI改进AI软件，更不用提它和微软的合作协议。

开源的繁荣，是大厂的「施舍」？

不过，这种建立在开源基础上的繁荣，是不稳定的。

目前大多数的开源，仍然依赖于资金雄厚的大公司发布的巨型模型。如果OpenAI和Meta决定关闭业务，繁荣的开源社区，可能就会变得萧条。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

比如，现在许多开源平替是基于Meta的LLaMA构建的。

而其他模型使用的是名为Pile的大型公共数据集，由开源非营利组织EleutherAI整理。

EleutherAI之所以存在，是因为OpenAI的开放性意味着一群开发者能够逆向了解GPT-3是如何制作的，然后在空闲时间里创建自己的模型。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

但一切都可能改变。

OpenAI已经不再Open，Meta也在考虑限制开源，防止初创公司利用开源代码做坏事。

Meta AI的执行董事Joelle Pineau表示，现在向外部人员开放代码是正确，但他并不确定，在未来五年内Meta还会采用相同的策略。

如果这种Close的趋势继续下去，那么不仅开源社区会被抛弃，下一代的AI突破也会重新回到那些最大、最不差钱的AI实验室手中。

显然，AI大模型的制造和使用方式的未来，正处于一个十字路口。

如果OpenAI曾经吝啬，就不会有如今的开源盛况

其他人也在权衡，这种开源的自由竞争带来的回报更大，还是风险更大。

就在Meta AI发布LLaMA的同时，Hugging Face推出了一个门禁机制，下载平台上的模型之前，用户必须申请访问并获得批准，这是为了限制那些有合法理由的人。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

「我并不是一个开源的布道者，」Hugging Face的首席伦理科学家Margaret Mitchell说。「我能看到不开源的意义。」

大模型广泛使用的一个弊端，就是可能造成AI色情产品的泛滥。

Mitchell曾在谷歌工作，并创立了AI道德团队，她对于模型被滥用的风险十分了解。因此，她赞成Meta AI以有控制的方式发布模型。

同时，OpenAI也在关闭水龙头。GPT-4发布时，并没有公布架构（包括模型大小）、硬件、训练计算、数据集构建、训练方法等细节，理由是「鉴于像GPT-4这样的大规模模型的竞争格局和安全影响」。

这种限制反应了OpenAI心态上的变化。联合创始人兼首席科学家Ilya Sutskever表示，OpenAI过去的开放性是一个错误。

OpenAI的政策研究员Sandhini Agarwal说：「以前，如果某样东西是开源的，也许一小群修理工会关心。但现在，整个环境已经改变。开源真的可以加速发展，导致竞争。」

时间倒回三年前，如果OpenAI在公布GPT-3的细节时，就秉持着同样的原则，那就不会有EleutherAI的出现，也就不会有蓬勃的开源创新。

今天，EleutherAI在开源生态系统中发挥着举足轻重的作用。Pile被用来训练多个开源项目，包括Stability AI的StableLM。

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

但随着GPT-4、5、6被锁死，开源社区可能会再次被落在几家大公司后面。

他们会困在上一代模型中，如果想取得进步，只能闭门造车。

以上是重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

易于理解的解释如何保存对话历史记录（对话日志）！May 16, 2025 am 05:41 AM

高效保存ChatGPT对话记录的多种方法您是否曾想过保存ChatGPT生成的对话记录？本文将详细介绍多种保存方法，包括官方功能、Chrome扩展程序和截图等，助您充分利用ChatGPT对话记录。了解各种方法的特点和步骤，选择最适合您的方式。 [OpenAI最新发布的AI代理“OpenAI Operator”介绍](此处应插入OpenAI Operator的链接) 目录使用ChatGPT导出功能保存对话记录官方导出功能的使用步骤使用Chrome扩展程序保存ChatGPT日志 ChatGP

使用Chatgpt创建时间表！解释可用于创建和调整表的提示May 16, 2025 am 05:40 AM

现代社会节奏紧凑，高效的日程管理至关重要。工作、生活、学习等任务交织在一起，优先级排序和日程安排常常让人头疼不已。因此，利用AI技术的智能日程管理方法备受关注。特别是利用ChatGPT强大的自然语言处理能力，可以自动化繁琐的日程安排和任务管理，显着提高生产力。本文将深入讲解如何利用ChatGPT进行日程管理。我们将结合具体的案例和步骤，展示AI如何提升日常生活和工作效率。此外，我们还会讨论使用ChatGPT时需要注意的事项，确保安全有效地利用这项技术。立即体验ChatGPT，让您的日程

如何将chatgpt与电子表格连接！对您可以做什么的详尽解释May 16, 2025 am 05:39 AM

我们将解释如何将Google表和Chatgpt联系起来，以提高业务效率。在本文中，我们将详细解释如何使用易于使用的“床单和文档的GPT”附加组件。无需编程知识。通过CHATGPT和电子表格集成提高业务效率本文将重点介绍如何使用附加组件将Chatgpt与电子表格连接。附加组件使您可以轻松地将ChatGpt功能集成到电子表格中。 gpt for shee

6个投资者对AI的预测于2025年May 16, 2025 am 05:37 AM

专家们预测AI革命的未来几年，专家们预测专家们都在强调了总体趋势和模式。例如，对数据的需求很大，我们将在后面讨论。此外，对能量的需求是D

使用chatgpt进行写作！提示的提示和示例的详尽说明！May 16, 2025 am 05:36 AM

Chatgpt不仅是文本生成工具，而且是一个真正的合作伙伴，可显着提高作家的创造力。通过在整个写作过程中使用chatgpt，例如初始手稿创建，构思想法和风格变化，您可以同时节省时间并提高质量。本文将详细说明在每个阶段使用Chatgpt的特定方法，以及最大化生产力和创造力的技巧。此外，我们将研究将Chatgpt与语法检查工具和SEO优化工具相结合的协同作用。通过与AI的合作，作家可以通过免费想法创造独创性

如何在chatgpt中创建图形！无需插件，因此也可以用于Excel！May 16, 2025 am 05:35 AM

使用chatgpt的数据可视化：从图创建到数据分析数据可视化以易于理解的方式传达复杂信息，在现代社会中至关重要。近年来，由于AI技术的进步，使用Chatgpt的图形创建引起了人们的关注。在本文中，我们将解释如何以易于理解的方式使用Chatgpt创建图形，甚至对于初学者。我们将介绍免费版本和付费版本（Chatgpt Plus），特定创建步骤以及如何显示日语标签以及实际示例之间的差异。使用chatgpt创建图形：从基础到高级使用 chatg

用餐盘推动现代LLM的极限？May 16, 2025 am 05:34 AM

通常，我们知道AI很大，而且越来越大。快速，越来越快。但是，具体来说，并不是每个人都熟悉行业中一些最新的硬件和软件方法，以及它们如何促进更好的结果。人民

归档您的Chatgpt对话历史！解释保存的步骤以及如何还原May 16, 2025 am 05:33 AM

ChatGPT对话记录管理指南：高效整理，充分利用你的知识宝库！ ChatGPT对话记录是创意和知识的源泉，但不断增长的记录如何有效管理呢？查找重要信息耗时费力？别担心！本文将详细讲解如何有效“归档”（保存和管理）你的ChatGPT对话记录。我们将涵盖官方归档功能、数据导出、共享链接以及数据利用和注意事项。目录 ChatGPT的“归档”功能详解 ChatGPT归档功能使用方法 ChatGPT归档记录的保存位置和查看方法 ChatGPT归档记录的取消和删除方法取消归档删除归档总结 Ch

See all articles