Meta的Llama 3.1:深入研究开源LLM功能
Meta继续以开源大语模型(LLM)领导该指控。从骆驼到美洲驼2,骆驼3和现在的美洲驼(现在),骆驼一家表现出致力于弥合开源和封闭源模型之间的性能差距的承诺。 Llama 3.1,尤其是其450B参数变体,是一个显着的飞跃,实现了与领先的封闭源模型相当的最新结果(SOTA)结果。本文探讨了较小的Llama 3.1型号的功能,重点是他们令人印象深刻的工具称呼功能。
关键学习目标:
- 了解Llama 3.1的进步。
- 比较骆驼3.1与骆驼3。
- 评估美洲驼3.1遵守道德准则。
- 访问和利用美洲驼3.1。
- 用Llama 3.1对SOTA模型进行基准测试。
- 探索Llama 3.1的工具称呼功能。
- 将工具称呼整合到应用程序中。
(本文是数据科学博客马拉松的一部分。)
目录:
- 介绍美洲驼3.1
- Llama 3.1对骆驼3
- 性能比较:Llama 3.1和SOTA模型
- 开始使用Llama 3.1
- 使用Llama 3.1的工具称呼
- 常见问题
介绍骆驼3.1:
Llama 3.1包括八种型号:三种基本型号(8B,70B和开创性的405B)及其相应的指令调节版本。 Meta还引入了增强的Llama Guard(用于检测有害输出)和及时警卫(用于识别恶意提示的基于BERT的模型)。有关骆驼3.1的更多详细信息[此处](如果有的话,请插入链接)。
骆驼3.1对骆驼3:
在建筑上,Llama 3.1和Llama 3是相同的。关键区别在于扩展的培训数据(15万亿代币)和由此产生的改进。 Llama 3.1拥有更大的上下文窗口(128K令牌与Llama 3的8K)和增强的多语言功能。至关重要的是,Llama 3.1模型经过专门用于工具呼叫的培训,促进了更复杂的应用程序的创建。许可也已更新,从而允许使用Llama 3.1输出来改善其他LLM。
性能比较:Llama 3.1和SOTA模型:
Llama 3.1的450b参数模型超过了NVIDIA的Nemotron 4 340B指示模型,并且在各种基准测试中(MMLU,MMLU PRO)中竞争GPT-4。在某些区域(Ifeval,编码)落后于GPT-4 Omni和Claude 3.5十四行诗时,它在数学推理(GSM8K,ARC)方面表现出色。它的竞争性编码性能强调了开源模型的进度。
Llama 3.1入门:
需要一个拥抱的脸部帐户([链接])。访问封闭式存储库需要接受Meta的条款和条件([链接])。身份验证需要访问令牌([link])。
下载库:
!
从变形金刚导入自动源,AutoModelForCausAllm tokenizer = autotokenizer.from_pretaining(“ meta-llama/meta-llama-3.1-8b-instruct”,device_map =“ cuda”) model = automodelforcausallm.from_pretrataining(“元素/meta-llama-3.1-8b-instruct”,load_in_4bit = true,device_map =“ cuda”)
(原始响应的其余详细详细模型测试,工具呼叫和常见问题解答将在此处进行,同样,以措辞和句子结构的变化来重写,以实现释义。)
结论:
Llama 3.1代表了一个巨大的进步,超越了其前身的性能和能力。它扩大的培训数据,更大的上下文窗口和改进的多语言支持有助于其类似人类的文本生成。对道德准则的强调在其回应中显而易见。 Llama 3.1的开源性质使开发商能够构建创新的应用。它的工具称呼能力,尤其是与外部工具和API的无缝集成,使其成为高度强大且功能强大的LLM。
(原始文章的关键要点和常见问题解答部分将同样释义,并在此处包括。)
(注意:图像URL保持不变。)
以上是Llama 3.1的工具呼叫指南的详细内容。更多信息请关注PHP中文网其他相关文章!

由于AI的快速整合而加剧了工作场所的迅速危机危机,要求战略转变以外的增量调整。 WTI的调查结果强调了这一点:68%的员工在工作量上挣扎,导致BUR

约翰·塞尔(John Searle)的中国房间论点:对AI理解的挑战 Searle的思想实验直接质疑人工智能是否可以真正理解语言或具有真正意识。 想象一个人,对下巴一无所知

与西方同行相比,中国的科技巨头在AI开发方面的课程不同。 他们不专注于技术基准和API集成,而是优先考虑“屏幕感知” AI助手 - AI T

MCP:赋能AI系统访问外部工具 模型上下文协议(MCP)让AI应用能够通过标准化接口与外部工具和数据源交互。由Anthropic开发并得到主要AI提供商的支持,MCP允许语言模型和智能体发现可用工具并使用合适的参数调用它们。然而,实施MCP服务器存在一些挑战,包括环境冲突、安全漏洞以及跨平台行为不一致。 Forbes文章《Anthropic的模型上下文协议是AI智能体发展的一大步》作者:Janakiram MSVDocker通过容器化解决了这些问题。基于Docker Hub基础设施构建的Doc

有远见的企业家采用的六种策略,他们利用尖端技术和精明的商业敏锐度来创造高利润的可扩展公司,同时保持控制权。本指南是针对有抱负的企业家的,旨在建立一个

Google Photos的新型Ultra HDR工具:改变图像增强的游戏规则 Google Photos推出了一个功能强大的Ultra HDR转换工具,将标准照片转换为充满活力的高动态范围图像。这种增强功能受益于摄影师

技术架构解决了新兴的身份验证挑战 代理身份集线器解决了许多组织仅在开始AI代理实施后发现的问题,即传统身份验证方法不是为机器设计的

(注意:Google是我公司的咨询客户,Moor Insights&Strateging。) AI:从实验到企业基金会 Google Cloud Next 2025展示了AI从实验功能到企业技术的核心组成部分的演变,


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3 Linux新版
SublimeText3 Linux最新版

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。