斯坦福“草泥马”火了：100美元就能比肩GPT-3.5！手机都能运行的那种

斯坦福“草泥马”火了：100美元就能比肩GPT-3.5！手机都能运行的那种

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 11, 2023 pm 07:24 PM

ai代码绘画

一夜之间，大模型界又炸出个big news！

斯坦福发布Alpaca（羊驼，网友口中的“草泥马”）：

只花100美元，人人都可微调Meta家70亿参数的LLaMA大模型，效果竟可比肩1750亿参数的GPT-3.5（text-davinci-003）。

而且还是单卡就能运行的那种，甚至树莓派、手机都能hold住！

还有一个更绝的“骚操作”。

研究所涉及到的数据集，是斯坦福团队花了不到500美元用OpenAI的API来生成的。

所以整个过程下来，就等同于GPT-3.5自己教出了个旗鼓相当的对手AI。

然后团队还说，用大多数云计算平台去微调训练好的模型，成本也不到100美元：

复制一个GPT-3.5效果的AI，很便宜，很容易，还很小。

而且团队还把数据集（秒省500刀）、代码统统都给开源了，这下子人人都能去微调个效果炸裂的对话AI：

项目在GitHub发布才半天时间，便已经狂揽1800+星，火爆程度可见一斑。

Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容：

不仅如此，斯坦福团队还搞了个demo，在线可玩的那种。

话不多说，我们现在就来看看这个“草泥马”的效果。

比肩davinci-003的草泥马Aplaca

在斯坦福官方的演示中，他们先小试牛刀地提了一个问题：

什么是羊驼？它和美洲驼的区别是什么？

草泥马Aplaca给出的答案较为干练：

羊驼是一种小型骆驼科动物，原产于秘鲁、玻利维亚、厄瓜多尔和智利；它比美洲驼小，羊毛更细，也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给ChatGPT（GPT3.5-turbo），则答案就不会像草泥马Aplaca那般简洁：

对此，团队给出的解释是：

Alpaca的答案通常比ChatGPT短，反映出text-davinci-003的输出较短。

而后团队演示了让草泥马Alpaca写邮件：

写一封e-mail祝贺被斯坦福大学录取的新生，并提到你很高兴能亲自见到他们。

草泥马Alpaca对于这个任务也是信手拈来，直接给出了一个像模像样的邮件模板：

难度再次进阶，团队这次提出了让草泥马Alpaca写论文摘要的需求：

写一篇经过深思熟虑的机器学习论文摘要，证明42是训练神经网络的最优seed。

草泥马Alpaca给出的答案从内容上来看，非常符合大多数论文的摘要形式：试图回答什么问题、用了什么方法、结果如何，以及未来展望。

当然，也有迫不及待的网友亲自下场试验，发现草泥马Alpaca写代码也是不在话下。

不过即便草泥马Alpaca能够hold住大部分问题，但这并不意味着它没有缺陷。

例如团队便演示了一个例子，在回答“坦桑尼亚的首都是哪里”的问题时，草泥马Alpaca给出的答案是“达累斯萨拉姆”。

但实际上早在1975年便被“多多马”取代了。

除此之外，若是亲自体验过草泥马Alpaca就会发现，它……巨慢：

对此，有网友认为可能是使用的人太多的原因。

笔记本、手机、树莓派都能跑

Meta开源的LLaMA大模型，刚发布几周就被大家安排明白了，单卡就能运行。

所以理论上，基于LLaMA微调的Alpaca同样可以轻松在本地部署。

没有显卡也没关系，苹果笔记本甚至树莓派、手机都可以玩。

在苹果笔记本部署LLaMA的方法来自GitHub项目llama.cpp，使用纯C/C++做推理，还专门对ARM芯片做了优化。

作者实测，M1芯片的MacBook Pro上即可运行，另外也支持Windows和Linux系统。

还是这个C++移植版本，有人成功在4GB内存的树莓派4上成功运行了LLaMA的 70亿参数版本。

虽然速度非常慢，大约10秒生成一个token（也就是一分钟蹦出4.5个单词）。

更离谱的是仅仅2天之后，有人把LLaMA模型量化压缩（权重转换成更低精度的数据格式）后成功在Pixel 6安卓手机上运行（26秒一个token）。

Pixel 6使用谷歌自研处理器Google Tensor，跑分成绩在骁龙865+到888之间，也就是说新一点的手机理论上都能胜任。

微调数据集也开源

斯坦福团队微调LLaMA的方法，来自华盛顿大学Yizhong Wang等去年底提出的Self-Instruct。

以175个问题作为种子任务，让AI自己从中组合出新的问题以及生成配套答案实例，人工过滤掉低质量的，再把新任务添加到任务池里。

所有这些任务，之后可以采用InstructGPT的方法让AI学会如何遵循人类指令。

套娃几圈下来，相当于让AI自己指导自己。

斯坦福版Alpaca，就是花了不到500美元使用OpenAI API生成了5.2万个这样的示例搞出来的。

这些数据同样开源了出来，并且比原论文的数据多样性更高。

同时还给出了生成这些数据的代码，也就是说如果有人还嫌不够，可以再去自行扩充微调数据，继续提高模型的表现。

微调代码也会在HuggingFace官方支持LLaMA后放出。

不过Alpaca最终的模型权重需要Meta许可才能发布，并且继承了LLaMA的非商用开源协议，禁止任何商业用途。

并且由于微调数据使用了OpenAI的API，根据使用条款也禁止用来开发与OpenAI形成竞争的模型。

One More Thing

还记得AI绘画的发展历程吗？

2022年上半年还只是话题热度高，8月份Stable Diffusion的开源让成本下降到可用，并由此产生爆炸式的工具创新，让AI绘画真正进入各类工作流程。

语言模型的成本，如今也下降到了个人电子设备可用的程度。

最后还是由Django框架创始人Simon Willison喊出：

大语言模型的Stable Diffusion时刻到了。

以上是斯坦福“草泥马”火了：100美元就能比肩GPT-3.5！手机都能运行的那种的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

免费生成的AI课程：开创创新的未来

免费生成的AI课程：开创创新的未来Apr 19, 2025 am 10:01 AM

生成的AI：革命性的创造力和创新生成的AI通过按下按钮来创建文本，图像，音乐和虚拟世界来改变行业。它的影响跨越视频编辑，音乐制作，艺术，娱乐，HEA

使用通用句子编码器和Wikiqa创建QA模型

使用通用句子编码器和Wikiqa创建QA模型Apr 19, 2025 am 10:00 AM

利用嵌入模型的力量来回答高级问题在当今信息丰富的世界中，立即获得精确答案的能力至关重要。本文展示了使用强大的提问（QA）模型

前十名必须阅读机器学习研究论文

前十名必须阅读机器学习研究论文Apr 19, 2025 am 09:53 AM

本文探讨了十个彻底改变人工智能（AI）和机器学习（ML）的开创性出版物。我们将研究神经网络和算法的最新突破，并解释驱动现代AI的核心概念。 Th

替换SEO机构的11个AI工具 - 分析Vidhya

替换SEO机构的11个AI工具 - 分析VidhyaApr 19, 2025 am 09:49 AM

AI在SEO中的崛起：超过SEO代理商的前11个工具 AI的快速发展已深刻地重塑了SEO景观。旨在提高顶级搜索引擎排名的企业正在利用AI优化其在线策略的能力。来自AU

前10个免费的AI游乐场供您在2025年尝试-Analytics Vidhya

前10个免费的AI游乐场供您在2025年尝试-Analytics VidhyaApr 19, 2025 am 09:45 AM

探索2024年最好的免费AI游乐场：综合指南访问正确的工具和平台是在不断发展的人工智能（AI）领域学习和创新的关键。 AI游乐场提供了绝佳的机会

矢量数据库中索引算法的详细指南

矢量数据库中索引算法的详细指南Apr 19, 2025 am 09:41 AM

介绍向量数据库是专门的数据库，旨在有效地存储和检索高维矢量数据。这些向量代表数据点的特征或属性，范围从数十到数千个维度，具体取决于

反向扩散过程是什么？ - 分析Vidhya

反向扩散过程是什么？ - 分析VidhyaApr 19, 2025 am 09:40 AM

稳定的扩散：揭示反向扩散的魔力稳定的扩散是一种强大的生成模型，能够从噪声中产生高质量的图像。此过程涉及两个关键步骤：正向扩散过程（在上一个A中详细介绍

掌握及时工程中的字典技术链

掌握及时工程中的字典技术链Apr 19, 2025 am 09:38 AM

解锁AI潜力：词典链，用于增强及时工程在人工智能和自然语言处理的快速发展的景观中，速度和效率至关重要。词典方法e

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

刺客信条阴影：贝壳谜语解决方案

3 周前ByDDD

Windows 11 KB5054979中的新功能以及如何解决更新问题

2 周前ByDDD

在哪里可以找到原子中的起重机控制钥匙卡

3 周前ByDDD

节省R.E.P.O.解释（并保存文件）

1 个月前By尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影 - 如何找到铁匠，解锁武器和装甲定制

4 周前ByDDD

热工具

mPDF

mPDF

mPDF是一个PHP库，可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件，并处理不同的语言。与原始脚本如HTML2FPDF相比，它的速度较慢，并且在使用Unicode字体时生成的文件较大，但支持CSS样式等，并进行了大量增强。支持几乎所有语言，包括RTL（阿拉伯语和希伯来语）和CJK（中日韩）。支持嵌套的块级元素（如P、DIV），

SublimeText3 英文版

SublimeText3 英文版

推荐：为Win版本，支持代码提示！

SublimeText3汉化版

SublimeText3汉化版

中文版，非常好用

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

VSCode Windows 64位下载

VSCode Windows 64位下载

微软推出的免费、功能强大的一款IDE编辑器

热门话题

gmail邮箱登陆入口在哪里

7564

15

1386

52

steam的账户名称是什么格式

87

11

win11激活密钥永久

61

19

NYT连接提示和答案

28

102