解锁骆驼的力量3.2:综合指南和本地部署
大语模型(LLM)的景观正在迅速发展,重点是较小,更有效的模型。 Llama 3.2凭借其轻巧和视力模型的变化体现了这一趋势。本教程详细介绍了如何利用Llama 3.2的功能,特别是3B轻型模型,用于在客户支持数据集上进行微调以及使用JAN应用程序进行的本地部署。 在潜水之前,强烈鼓励初学者完成AI基础知识课程,以掌握LLM和生成AI的基础。>作者的图像
探索骆驼3.2型号
轻量级模型
轻巧的家族包括1B和3B参数变体。 它们的紧凑型尺寸允许进行设备处理,确保数据隐私和快速,成本效益的文本生成。 这些模型利用修剪和知识蒸馏来提高效率和性能。 3B模型超过了诸如Gemma 2和Phi 3.5-Mini之类的竞争对手,例如诸如教学和摘要之类的任务。
>来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉
视觉模型
视觉模型(11b和90b参数)是为图像推理而设计的,能够解释文档和图表。 它们的多模式能力源于将预训练的图像编码与语言模型集成在一起。 在视觉理解任务中,他们的表现优于克劳德3 haiku和gpt-4o mini。
来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉
以深入了解Llama 3.2的架构,基准和安全功能(Llama Guard 3),请参阅《官方Llama 3.2指南》。
>在Kaggle上访问Llama 3.2虽然Llama 3.2是开源的,但访问需要接受条款和条件。 这是通过kaggle访问它的方法:
- >请访问llama.com,填写访问表格,选择轻量级和视觉模型。 >导航到元| Llama 3.2型号页面上的型号并提交表格。
- 接受条款和条件。
- 等待笔记本创建选项。 选择“变形金刚”选项卡,选择您的模型变体,然后创建一个新的笔记本。
- 将加速器配置为“ gpu t4 x2”。 >
- >使用 。
-
transformers
随后的步骤涉及使用accelerate
库库加载令牌和模型,指定本地模型目录,设置%pip install -U transformers accelerate
,创建文本生成管道以及使用自定义提示的运行推断。 随附的Kaggle笔记本中提供了详细的代码示例。 类似的步骤适用于访问Llama 3.2视觉模型,尽管GPU要求明显更高。 >微调美洲驼3.2 3b指示
>本节通过微调Llama 3.2 3B指示模型在客户支持数据集上使用transformers
library和Qlora进行有效培训。
>设置
- 启动一个新的Kaggle笔记本和设置环境变量,用于拥抱面部和重量和偏见(WANDB)访问。
- 安装必要的软件包:
transformers
,datasets
,accelerate
,peft
,trl
,bitsandbytes
,wandb
和 。
- >使用您的API键登录以拥抱脸和魔杖。 >
- >定义基本模型,新模型名称和数据集名称的变量。
- 根据您的GPU功能确定适当的
- >>>>。
torch_dtype
>使用attn_implementation
进行4位量化的模型以最大程度地减少内存使用情况。 >
- 加载令牌。
BitsAndBytesConfig
- 加载和处理数据集
>加载
。- 洗牌并选择数据的子集(例如,1000个样本以进行更快的培训)。
bitext/Bitext-customer-support-llm-chatbot-training-dataset
>通过将系统指令,用户查询和助手响应组合到聊天格式中,创建一个“文本”列。
- 设置模型
-
apply_chat_template
>使用辅助函数识别所有线性模块名称。
使用
- 对lora进行配置。
- >设置
- ,并使用适当的超参数来进行高效培训。
LoraConfig
创建一个 - 实例,提供模型,数据集,洛拉配置,培训参数和令牌。
TrainingArguments
> - 模型培训
SFTTrainer
使用
模型推理
trainer.train()
>测试使用数据集中的示例提示的微调模型。
保存模型
>在本地保存微调模型,然后将其推到拥抱的脸上轮毂。
合并和导出微调模型>本节详细介绍了将微调的洛拉适配器与基本型号合并,并将其导出到拥抱的面轮。 它涉及加载基本模型和洛拉适配器,使用
>和
合并它们,然后保存并将合并模型推到集线器。>转换为gguf和本地部署
最后,教程将使用GGGUF我的回购工具在拥抱脸部和使用JAN应用程序本地部署它时将合并模型转换为GGGUF格式。 这涉及下载GGUF文件,将其导入JAN,并设置系统提示并停止令牌以获得最佳性能。结论
以上是微调美洲驼3.2并在本地使用:逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章!

本文展示了AI如何以Tomorrow.io为典型的例子来彻底改变空间行业。 与像SpaceX这样的建立太空公司不同,SpaceX并非没有AI的核心,明天是AI本地公司。 让我们探索

在印度(2025)登陆您梦想中的机器学习实习! 对于学生和早期职业专业人员来说,机器学习实习是一个有意义的职业的完美发射台。 跨不同部门的印度公司 - 尖端的基因

在过去的一年中,在线浏览的景观经历了重大转变。 这种转变始于增强的个性化搜索结果,例如困惑和副标士,并随着Chatgpt的整合而加速

网络攻击正在发展。 通用网络钓鱼电子邮件的日子已经一去不复返了。 网络犯罪的未来是超个性化的,利用了容易获得的在线数据和AI来制作高度针对性的攻击。 想象一个知道您的工作的骗子

新当选的教皇狮子座(Leo Xiv)在对红衣主教学院的就职演讲中,讨论了他的同名人物教皇里奥XIII的影响,他的教皇(1878-1903)与汽车和汽车和汽车公司的黎明相吻合

本教程演示了如何使用模型上下文协议(MCP)和FastAPI将大型语言模型(LLM)与外部工具集成在一起。 我们将使用FastAPI构建一个简单的Web应用程序,并将其转换为MCP服务器,使您的L

探索DIA-1.6B:由两个本科生开发的开创性的文本对语音模型,零资金! 这个16亿个参数模型产生了非常现实的语音,包括诸如笑声和打喷嚏之类的非语言提示。本文指南

我完全同意。 我的成功与导师的指导密不可分。 他们的见解,尤其是关于业务管理,构成了我的信念和实践的基石。 这种经验强调了我对导师的承诺


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

记事本++7.3.1
好用且免费的代码编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。