Meta的Llama 4:开源AI Powerhouses的三重奏
Meta AI通过同时发布了Llama 4 Banner下的三种开创性的大语言模型(LLM),从而破坏了AI景观:Scout,Maverick和Beamemoth。这一举动与竞争对手的封闭,越来越大的模型的趋势形成鲜明对比。 Llama 4优先考虑可访问性,为更广泛的受众提供强大的AI工具。本文探讨了每个模型的独特功能和性能。
Llama 4侦察员:重新定义效率
Scout是Llama 4家族的轻量级冠军。专为资源受限的环境而设计,非常适合无法获得广泛的GPU资源的开发人员和研究人员。
关键特征: Scout采用专家(MOE)体系结构的混合物,在任何给定时间仅激活其109B参数(17B活动)的一小部分。它拥有一个显着的1000万令牌上下文窗口,并使用INT4量化在单个H100 GPU上有效运行。预先训练200种语言(每种超过十亿个代币)和多样化的图像/视频数据,每个提示最多支持8张图像。
性能:基准测试表明,侦察兵的表现优于Gemini 3和Mismtral 3.1的可比较模型。其高级图像区域接地可以精确的视觉推理。
理想的应用程序:长篇小说聊天机器人,代码摘要工具,教育问答系统以及移动/嵌入式助手。
Llama 4 Maverick:多功能主力
Maverick是旗舰型开放式型号,用于高级推理,编码和多模式应用。虽然比侦察兵更强大,但它通过其MOE架构保持效率。
关键功能: Maverick使用的Moe体系结构具有128位路由专家和共享专家,在推理过程中激活其400B参数的17B。经过尖端技术(Metap Hypergaremeter缩放,FP8精度训练)训练,它利用了大量的300万亿代币数据集,并最多支持8个图像输入。
表现: Maverick在LMSYS Chatbot Arena上取得了令人印象深刻的ELO得分,超过了GPT-4O和Gemini 2.0 Flash。它显示出强烈的图像理解,多语言推理以及超过Llama 3.3 70b模型的成本效益的性能。
理想的应用程序: AI对编程,企业级文档的理解和教育辅导系统。
骆驼4庞然大物:无名英雄
迄今为止,Meta最大的模型Bememoth尚未公开可用。但是,它在教师模型中起着至关重要的作用,通过共同依据指导童子军和小牛的培训。
关键特征:庞然大物的庞大架构(约2万亿个参数)和高级训练技术在具有挑战性的基准方面可以表现出色。
角色:其主要功能是作为评估和内部模型改进的黄金标准。
访问美洲驼4型型号
Llama 4 Scout和Maverick很容易通过多个平台访问:
Llama.meta.com:Meta的llama型号的官方枢纽,提供模型卡,纸张,文档和使用模型权重的访问。
拥抱脸:提供现成的测试和部署版本。
META应用程序:集成到WhatsApp,Instagram,Messenger和Facebook中,允许用户直接与其应用程序中的模型进行交互。
Web界面:还可以通过Web界面进行直接访问。
Llama 4在行动:示例
虽然在Meta的应用程序和Web界面中使用的特定Llama 4模型尚未明确说明,但测试却揭示了令人印象深刻的功能:
创意计划:迅速生成详细的社交媒体策略。
编码:生成代码,尽管准确性可能需要改进。
图像生成:使用编辑和动画选项生成多个图像。
培训和培训后创新
Llama 4的成功源于复杂的两步训练过程:
预训练:采用多模式数据(文本,图像,视频),MOE体系结构,早期融合,Metap Hyperparameter Tuning,FP8 Precision和IROPE架构进行长篇文化处理。
培训后:利用轻巧的监督微调(SFT),在线增强学习(RL),直接偏好优化(DPO)和庞然大物共同依据,以提高性能和安全性。
基准性能摘要
每个模型都在特定领域出色:效率的侦察,整体性能的小牛和研究级基准测试的庞然大物。与领先模型相比,详细的基准结果强调了它们的出色性能。
模型比较表
模型 | 总参数 | 活动参数 | 专家 | 上下文长度 | 运行 | 公共访问 | 理想的 |
---|---|---|---|---|---|---|---|
侦察 | 109b | 17b | 16 | 10m令牌 | 单人H100 | ✅ | 轻巧的AI,长期内存应用程序 |
小牛 | 400B | 17b | 128 | 未列出 | 单/多GPU | ✅ | 研究,编码,企业 |
庞然大物 | 〜2t | 288b | 16 | 未列出 | 内部下属 | ❌ | 内部用途,基准 |
结论
Meta的Llama 4型号代表了AI可访问性和性能方面的重大飞跃。他们的开源性质使人们对尖端AI技术的访问权力民主,从而赋予了全球开发人员和研究人员的能力。对开放和效率的关注为AI开发的未来树立了新标准。
以上是Llama 4型号:Meta AI正在开放购买最好的! - 分析Vidhya的详细内容。更多信息请关注PHP中文网其他相关文章!

隐藏者的开创性研究暴露了领先的大语言模型(LLM)的关键脆弱性。 他们的发现揭示了一种普遍的旁路技术,称为“政策木偶”,能够规避几乎所有主要LLMS

对环境责任和减少废物的推动正在从根本上改变企业的运作方式。 这种转变会影响产品开发,制造过程,客户关系,合作伙伴选择以及采用新的

最近对先进AI硬件的限制突出了AI优势的地缘政治竞争不断升级,从而揭示了中国对外国半导体技术的依赖。 2024年,中国进口了价值3850亿美元的半导体

从Google的Chrome剥夺了潜在的剥离,引发了科技行业中的激烈辩论。 OpenAI收购领先的浏览器,拥有65%的全球市场份额的前景提出了有关TH的未来的重大疑问

尽管总体广告增长超过了零售媒体的增长,但仍在放缓。 这个成熟阶段提出了挑战,包括生态系统破碎,成本上升,测量问题和整合复杂性。 但是,人工智能

在一系列闪烁和惰性屏幕中,一个古老的无线电裂缝带有静态的裂纹。这堆积不稳定的电子设备构成了“电子废物土地”的核心,这是身临其境展览中的六个装置之一,&qu&qu

Google Cloud的下一个2025:关注基础架构,连通性和AI Google Cloud的下一个2025会议展示了许多进步,太多了,无法在此处详细介绍。 有关特定公告的深入分析,请参阅我的文章

本周在AI和XR中:一波AI驱动的创造力正在通过从音乐发电到电影制作的媒体和娱乐中席卷。 让我们潜入头条新闻。 AI生成的内容的增长影响:技术顾问Shelly Palme


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

Atom编辑器mac版下载
最流行的的开源编辑器

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中