首页 >科技周边 >人工智能 >Mistral与微软合作为'小语言模型'带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为'小语言模型'带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB转载: 2023-12-17 14:15:35842浏览

近来，"小语言模型"突然成为热门话题

本周一，刚刚完成4.15亿美元融资的法国AI初创公司Mistral，发布了Mixtral 8x7B模型。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

这个开源模型尽管尺寸不大，小到足以在一台内存100GB以上的电脑上运行，然而在某些基准测试中却能和GPT-3.5打平，因此迅速在开发者中赢得了一片称赞。

之所以叫Mixtral 8x7B，是因为它结合了为处理特定任务而训练的各种较小模型，从而提高了运行效率。

这种「稀疏专家混合」模型并不容易实现，据说OpenAI在今年早些时候因为无法让MoE模型正常运行，而不得不放弃了模型的开发。

紧接着，就在第二天，微软又发布了全新版本的Phi-2小模型。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Phi-2的规模只有27亿参数，比Mistral的规模小得多，仅足以在手机上运行。而与之相比，GPT-4的参数规模高达一万亿

Phi-2在精心挑选的数据集上进行了训练，数据集的质量足够高，因此即使手机的计算能力有限，也能确保模型生成准确的结果。

虽然还不清楚微软或其他软件制造商将如何使用小型模型，但最明显的好处，就是降低了大规模运行AI应用的成本，并且极大地拓宽了生成式AI技术的应用范围。

这是一个重要的事件

Mistral-medium代码生成完胜GPT-4

最近，Mistral-medium已经开始进行内测

有博主对比了开源的Mistral-medium和GPT-4的代码生成能力，结果显示，Mistral-medium比GPT-4的代码能力更强，然而成本却只需GPT-4的3成！

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

总价来说就是：

Mistral工作效率高，且完成工作的质量也很高

2）不会将token浪费在冗长的解释性输出上

3）给出的建议非常具体

首先，要编写用于生成斐波那契素数的PyTorch数据集的cuda优化代码

Mistral-Medium生成的代码严肃、完整。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

GPT-4生成的代码，勉勉强强还可以

浪费了很多token，却没有输出有用的信息。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

然后，GPT-4只给出了骨架代码，并没有具体的相关代码。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

第二道题是：编写高效的Python代码，将大约10亿个大型Apache HTTP访问文件导入SqlLite数据库，然后使用它来生成对sales.html和product.html的访问直方图

Mistral的输出非常出色，尽管log文件不是CSV格式的，但是修改起来很简单

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

GPT-4依旧拉跨。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

此前，这位博主测试过多个代码生成模型，GPT-4一直稳居第一。

目前，强大的竞争对手Mistral-medium终于出现，将其从宝座上推下

虽然只发布了两个例子，但博主测试了多个问题，结果都差不多。

他提出建议：考虑到Mistral-medium在代码生成质量方面提供更好的体验，应该将其整合到各地的代码助手中

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

有人按照每1000token算出了输入和输出的成本，发现Mistral-medium比起GPT-4直接降低了70%！

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

确实，节省了70%的令牌费用，这是一件大事。此外，通过简洁的输出，还可以进一步降低成本

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

以上是Mistral与微软合作为'小语言模型'带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3的详细内容。更多信息请关注PHP中文网其他相关文章！

Python html Token 事件数据库 apache pytorch http gpt

声明：

本文转载于：51cto.com。如有侵权，请联系admin@php.cn删除

上一篇：宏碁发布新款非凡 Go 笔记本，搭载 Acer Sense 应用，提供多种AI功能下一篇：谷歌 DeepMind 公布的“FunSearch”训练法：让 AI 模型能够解决复杂离散数学问题

查看更多