搜索
首页科技周边人工智能为何说小语言模型是AI界的下一大热门?

译者 | 布加迪

审校 | 重楼

AI领域,科技巨头们一直在竞相构建越来越庞大的语言模型,如今出现了一个令人惊讶的新趋势是大。随着大语言模型(LLM)方面的进展出现了停滞的迹象,研究人员和开发人员日益开始将注意力转向小语言模型(SLM)。这紧凑、高效、适应性强的AI模型正在挑战越大越好”这个观念,有望改变我们对待AI开发的方式。

为何说小语言模型是AI界的下一大热门?

LLM是否开始停滞?

VellumHuggingFace最近发布的性能比较结果表明,LLM之间的性能差距在迅速缩小。这趋势在多项选择题、推理和数学问题等特定任务中体现得尤为明显在这些任务中,各大模型之间的性能差异很小。比如在多项选择题中,Claude 3 OpusGPT-4Gemini Ultra准确率都在83%以上,而在推理任务中,Claude 3 OpusGPT-4Gemini 1.5 Pro的准确率超过92%

意思的是,较小的模型(比如Mixtral 8x7BLlama 2 - 70B在某些方面也显示出了让人惊喜的结果,比如推理和多项选择题在这些方面小模型的表现胜过一些大模型。这表明模型的大小可能不是决定性能的唯一因素,而架构、训练数据和微调技术等其他方面可能发挥重要作用。

Uber AI前负责人、《重启人工智能》Rebooting AI一书的作者Gary Marcus表示:“如果看一下最近发表的十几篇文章,它们大体上都与GPT-4处于同一个水准。《重启人工智能》讲述了如何构建值得信赖的AIMarcus周四接受了IT外媒《VentureBeat的采访。

“其中一些比GPT-4好一点,但没有大的飞跃。我想每个人都会说GPT-4GPT-3.5是一大进步一年多的时间里没有任何大飞跃。

随着性能差距继续缩小,多的模型显示出颇具竞争力的结果,这引发了LLM是否真的开始停滞的问题。如果这种趋势持续下去,可能会对语言模型的未来开发和部署产生重大影响,人们关注的心可能会由一味增加模型大小转探索更有效更专门化架构上。

LLM方法的缺点

虽然不可否认LLM功能强大,但也有明显的缺点。首先,训练LLM需要大量的数据,需要数十亿甚至数万亿个参数。这使得训练过程极其耗费资源,训练和运行LLM所需的算和能耗是惊人的。这导致了成本高企,使得小组织或个人很难参与核心LLM开发。在去年麻省理工学院组织的一次活动上,OpenAI首席执行官Sam Altman表示,训练GPT-4的成本至少为1亿美元。

处理LLM所需的工具和技术的复杂性也将一条陡峭的学习曲线摆在开发人员的面前,进一步限制了可访问性。从模型训练到构建和部署,开发人员面临的周期很长,这减慢了开发和试验的速度。剑桥大学最近的一篇论文显示,公司部署单单一个机器学习模型可能要花90天或更长时间

LLM的另一个重要问题是它们往往产生幻觉——生成看似合理但实际上并不真实的输出。这源于LLM被训练成基于训练数据中的模式来预测下一个最有可能的单词的方式,而不是真正了解信息因此,LLM可以自信地做出虚假陈述,编造事实或以荒谬的方式组合不相关的概念。检测和减轻这幻觉现象是开发可靠的语言模型面临老大难问题

Marcus警告:“如果你用LLM来解决重大问题,不想侮辱客户得到错误的医疗信息,或者用它来驾驶汽车。这仍然是个问题。

LLM的规模和黑盒性质也使它们难以解释和调试,解释和调试对于模型的输出建立信任至关重要。训练数据和算法中的偏差可能导致不公平、不准确甚至有害的输出。正如我们在谷歌Gemini看到,使LLM安全”而可靠的技术也会降低其有效性。此外,LLM的集中性质引发了对权力和控制权集中在少数大型科技公司手中的担忧。

小语言模型(SLM)登场

这时候小语言模型登场了SLMLLM的精简版,参数更少,设计更简单。它们所需的数据和训练时间更短,只需几分钟或几个小时,而LLM需要几天。这使得SLM部署在本地或小型设备上来得高效更简单。

SLM的主要优点之一是它们适合特定的应用环境由于它们关注的范围更狭小,需要更少的数据,所以大型通用模型更容易针对特定领域或任务进行微调。这种定制使公司能够创建对其特定需求而言非常效的SLM,比如情绪分析、命名实体识别或特定领域的问题回答。与使用通用模型相比,SLM的专门化特性可以提升其在这些目标应用环境的性能和效率。

SLM的另一个好处是有望增强隐私和安全。使用更小的代码库和更简单的架构,SLM更容易审计,并且不太可能出现意外漏洞。这使得它们对于处理敏感数据的应用环境颇有吸引力,比如在医疗保健或金融领域,数据泄露可能酿成严重后果。此外,SLM的计算需求减少,使得它们更适合在本地设备或本地服务器上运行,而不是依赖云基础设施。这种本地处理可以进一步提高数据安全性,降低数据传输过程中暴露风险。

LLM相比,SLM在特定领域内更不容易出现未被发现的幻觉。SLM通常使用预期领域或应用环境特有的更狭窄、更有针对性的数据集进行训练,这有助于模型学习与其任务最相关的模式、词汇表和信息。这就降低生成不相关、意外或不一致输出的可能性。由于使用更少的参数和更精简的架构,SLM不太容易捕获和放大训练数据中的噪或错误。

AI初创公司HuggingFace的首席执行官Clem Delangue表示,高达99%的用例可以使用SLM来解决,并预测2024年将是SLM年。HuggingFace的平台使开发人员能够构建、训练和部署机器学习模型,该公司今年早些时候宣布与谷歌建立战略合作伙伴关系。两家公司随后将HuggingFace整合到谷歌的Vertex AI中,允许开发人员通过谷歌Vertex Model Garden快速部署数千个模型。

谷歌Gemma受到追捧

在最初将LLM方面的优势拱手让给OpenAI之后,谷歌正积极抓住SLM机会。早在2月份,谷歌推出了Gemma,这是一系列新的小语言模型,旨在提高效率和用户友好性。与其他SLM一样,Gemma模型可以在各种普通设备上运行,如智能手机、平板电脑或笔记本电脑,不需要特殊的硬件或全面的优化。

Gemma发布以来,经过训练的模型上个月在HuggingFace上的下载量已经超过40万次,而且已涌现出了几个令人兴奋的项目。比如说,Cerule是一个功能强大的图像和语言模型,它结合了Gemma 2B和谷歌的SigLIP,使用大量的图像和文本数据集进行了训练。Cerule利用高效的数据选择技术,可以在不需要大量数据或计算的情况下实现高性能。这意味着Cerule可能非常适合新兴的边缘计算用例。

另一个例子是CodeGemma,它是Gemma的专门版,专注于编和数学推理。CodeGemma为各种编相关的活动提供了三种不同的模型,使高级编程工具对开发人员来说更容易访问、更高效。

小语言模型的巨大潜力

随着AI社区继续探索小语言模型的潜力,更快的开发周期、更高的效率以及能够根据特定需求定制模型等优点变得越来越明显。SLM有望通过带来具有成本效益、具有针对性的解决方案,普及AI访问,并推动行业创新。在边缘部署SLM为金融、娱乐、汽车系统、教育、电子商务和医疗保健等行业领域的实时、个性化和安全应用系统带来了新的可能性。

通过在本地处理数据并减少对云基础设施的依赖,结合SLM的边缘计算可以缩短响应时间、增强数据隐私和改进用户体验。这种去中心化的AI方法有望改变企业和消费者与技术进行互动方式,在现实世界中创造更个性化直观的体验。由于LLM面临与计算资源相关的挑战,可能遇到性能瓶颈,因此,LLM的兴起有望使AI生态系统继续惊人的步伐发展

原文标题:Why small language models are the next big thing in AI,作者:James Thomason

以上是为何说小语言模型是AI界的下一大热门?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
烹饪创新:人工智能如何改变食品服务烹饪创新:人工智能如何改变食品服务Apr 12, 2025 pm 12:09 PM

AI增强食物准备 在新生的使用中,AI系统越来越多地用于食品制备中。 AI驱动的机器人在厨房中用于自动化食物准备任务,例如翻转汉堡,制作披萨或组装SA

Python名称空间和可变范围的综合指南Python名称空间和可变范围的综合指南Apr 12, 2025 pm 12:00 PM

介绍 了解Python功能中变量的名称空间,范围和行为对于有效编写和避免运行时错误或异常至关重要。在本文中,我们将研究各种ASP

视觉语言模型(VLMS)的综合指南视觉语言模型(VLMS)的综合指南Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

联发科技与kompanio Ultra和Dimenty 9400增强优质阵容联发科技与kompanio Ultra和Dimenty 9400增强优质阵容Apr 12, 2025 am 11:52 AM

继续使用产品节奏,本月,Mediatek发表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。这些产品填补了Mediatek业务中更传统的部分,其中包括智能手机的芯片

本周在AI:沃尔玛在时尚趋势之前设定了时尚趋势本周在AI:沃尔玛在时尚趋势之前设定了时尚趋势Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:现在是星期一早上。作为AI驱动的招聘人员,您更聪明,而不是更努力。您在手机上登录公司的仪表板。它告诉您三个关键角色已被采购,审查和计划的FO

生成的AI遇到心理摩托车生成的AI遇到心理摩托车Apr 12, 2025 am 11:50 AM

我猜你一定是。 我们似乎都知道,心理障碍包括各种chat不休,这些chat不休,这些chat不休,混合了各种心理术语,并且常常是难以理解的或完全荒谬的。您需要做的一切才能喷出fo

原型:科学家将纸变成塑料原型:科学家将纸变成塑料Apr 12, 2025 am 11:49 AM

根据本周发表的一项新研究,只有在2022年制造的塑料中,只有9.5%的塑料是由回收材料制成的。同时,塑料在垃圾填埋场和生态系统中继续堆积。 但是有帮助。一支恩金团队

AI分析师的崛起:为什么这可能是AI革命中最重要的工作AI分析师的崛起:为什么这可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近与领先的企业分析平台Alteryx首席执行官安迪·麦克米伦(Andy Macmillan)的对话强调了这一在AI革命中的关键但不足的作用。正如Macmillan所解释的那样,原始业务数据与AI-Ready Informat之间的差距

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。