搜索
首页科技周边人工智能微调美洲驼3.2并在本地使用:逐步指南

解锁骆驼的力量3.2:综合指南和本地部署

大语模型(LLM)的景观正在迅速发展,重点是较小,更有效的模型。 Llama 3.2凭借其轻巧和视力模型的变化体现了这一趋势。本教程详细介绍了如何利用Llama 3.2的功能,特别是3B轻型模型,用于在客户支持数据集上进行微调以及使用JAN应用程序进行的本地部署。 在潜水之前,强烈鼓励初学者完成AI基础知识课程,以掌握LLM和生成AI的基础。

>作者的图像

Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide 探索骆驼3.2型号

Llama 3.2提供了两个模型系列:轻量级和视野。轻巧的模型在多语言文本生成和工具使用方面表现出色,非常适合资源受限环境。另一方面,视觉模型专门研究图像推理和多模式任务。

轻量级模型

轻巧的家族包括1B和3B参数变体。 它们的紧凑型尺寸允许进行设备处理,确保数据隐私和快速,成本效益的文本生成。 这些模型利用修剪和知识蒸馏来提高效率和性能。 3B模型超过了诸如Gemma 2和Phi 3.5-Mini之类的竞争对手,例如诸如教学和摘要之类的任务。

>

来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉

视觉模型

Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide 视觉模型(11b和90b参数)是为图像推理而设计的,能够解释文档和图表。 它们的多模式能力源于将预训练的图像编码与语言模型集成在一起。 在视觉理解任务中,他们的表现优于克劳德3 haiku和gpt-4o mini。

来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉

以深入了解Llama 3.2的架构,基准和安全功能(Llama Guard 3),请参阅《官方Llama 3.2指南》。

>在Kaggle上访问Llama 3.2

虽然Llama 3.2是开源的,但访问需要接受条款和条件。 这是通过kaggle访问它的方法:Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide

  1. >请访问llama.com,填写访问表格,选择轻量级和视觉模型。
  2. >导航到元| Llama 3.2型号页面上的型号并提交表格。
  3. 接受条款和条件。
  4. 等待笔记本创建选项。 选择“变形金刚”选项卡,选择您的模型变体,然后创建一个新的笔记本。
  5. 将加速器配置为“ gpu t4 x2”。
  6. >
  7. >使用
  8. transformers随后的步骤涉及使用accelerate库库加载令牌和模型,指定本地模型目录,设置%pip install -U transformers accelerate,创建文本生成管道以及使用自定义提示的运行推断。 随附的Kaggle笔记本中提供了详细的代码示例。 类似的步骤适用于访问Llama 3.2视觉模型,尽管GPU要求明显更高。
  9. >微调美洲驼3.2 3b指示

>本节通过微调Llama 3.2 3B指示模型在客户支持数据集上使用transformers library和Qlora进行有效培训。

>设置

  1. 启动一个新的Kaggle笔记本和设置环境变量,用于拥抱面部和重量和偏见(WANDB)访问。
  2. 安装必要的软件包:transformersdatasetsacceleratepefttrlbitsandbyteswandb
  3. >使用您的API键登录以拥抱脸和魔杖。
  4. >
  5. >定义基本模型,新模型名称和数据集名称的变量。
加载模型和令牌

    根据您的GPU功能确定适当的
  1. >>>>。 torch_dtype>使用attn_implementation进行4位量化的模型以最大程度地减少内存使用情况。
  2. >
  3. 加载令牌。BitsAndBytesConfig
  4. 加载和处理数据集

>加载

  1. 洗牌并选择数据的子集(例如,1000个样本以进行更快的培训)。bitext/Bitext-customer-support-llm-chatbot-training-dataset
  2. >通过将系统指令,用户查询和助手响应组合到聊天格式中,创建一个“文本”列。
  3. 设置模型
  4. apply_chat_template
  5. >使用辅助函数识别所有线性模块名称。

使用

    对lora进行配置。
  1. >设置
  2. ,并使用适当的超参数来进行高效培训。LoraConfig
  3. 创建一个
  4. 实例,提供模型,数据集,洛拉配置,培训参数和令牌。TrainingArguments>
  5. 模型培训SFTTrainer
  6. 使用
训练模型。 使用WANDB进行监视培训和验证损失。

模型推理

trainer.train()>测试使用数据集中的示例提示的微调模型。

>

保存模型

>在本地保存微调模型,然后将其推到拥抱的脸上轮毂。

合并和导出微调模型

>本节详细介绍了将微调的洛拉适配器与基本型号合并,并将其导出到拥抱的面轮。 它涉及加载基本模型和洛拉适配器,使用

>和

合并它们,然后保存并将合并模型推到集线器。

>转换为gguf和本地部署

最后,教程将使用GGGUF我的回购工具在拥抱脸部和使用JAN应用程序本地部署它时将合并模型转换为GGGUF格式。 这涉及下载GGUF文件,将其导入JAN,并设置系统提示并停止令牌以获得最佳性能。>

结论

微调较小的LLMS为定制特定任务的模型提供了一种经济高效且有效的方法。 本教程提供了一个实用指南,以利用Llama 3.2的功能,从访问和微调到本地部署,使用户能够构建和部署自定义AI解决方案。 切记查阅随附的Kaggle笔记本以获取详细的代码示例。

以上是微调美洲驼3.2并在本地使用:逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
AI太空公司诞生了AI太空公司诞生了May 12, 2025 am 11:07 AM

本文展示了AI如何以Tomorrow.io为典型的例子来彻底改变空间行业。 与像SpaceX这样的建立太空公司不同,SpaceX并非没有AI的核心,明天是AI本地公司。 让我们探索

印度的10个机器学习实习(2025)印度的10个机器学习实习(2025)May 12, 2025 am 10:47 AM

在印度(2025)登陆您梦想中的机器学习实习! 对于学生和早期职业专业人员来说,机器学习实习是一个有意义的职业的完美发射台。 跨不同部门的印度公司 - 尖端的基因

尝试Fellou AI并向Google和Chatgpt说再见尝试Fellou AI并向Google和Chatgpt说再见May 12, 2025 am 10:26 AM

在过去的一年中,在线浏览的景观经历了重大转变。 这种转变始于增强的个性化搜索结果,例如困惑和副标士,并随着Chatgpt的整合而加速

个人黑客将是一只非常凶猛的熊个人黑客将是一只非常凶猛的熊May 11, 2025 am 11:09 AM

网络攻击正在发展。 通用网络钓鱼电子邮件的日子已经一去不复返了。 网络犯罪的未来是超个性化的,利用了容易获得的在线数据和AI来制作高度针对性的攻击。 想象一个知道您的工作的骗子

教皇狮子座XIV揭示了AI如何影响他的名字选择教皇狮子座XIV揭示了AI如何影响他的名字选择May 11, 2025 am 11:07 AM

新当选的教皇狮子座(Leo Xiv)在对红衣主教学院的就职演讲中,讨论了他的同名人物教皇里奥XIII的影响,他的教皇(1878-1903)与汽车和汽车和汽车公司的黎明相吻合

Fastapi -MCP初学者和专家教程-Analytics VidhyaFastapi -MCP初学者和专家教程-Analytics VidhyaMay 11, 2025 am 10:56 AM

本教程演示了如何使用模型上下文协议(MCP)和FastAPI将大型语言模型(LLM)与外部工具集成在一起。 我们将使用FastAPI构建一个简单的Web应用程序,并将其转换为MCP服务器,使您的L

dia-1.6b tts:最佳文本到二元格生成模型 - 分析vidhyadia-1.6b tts:最佳文本到二元格生成模型 - 分析vidhyaMay 11, 2025 am 10:27 AM

探索DIA-1.6B:由两个本科生开发的开创性的文本对语音模型,零资金! 这个16亿个参数模型产生了非常现实的语音,包括诸如笑声和打喷嚏之类的非语言提示。本文指南

AI可以使指导比以往任何时候都更有意义AI可以使指导比以往任何时候都更有意义May 10, 2025 am 11:17 AM

我完全同意。 我的成功与导师的指导密不可分。 他们的见解,尤其是关于业务管理,构成了我的信念和实践的基石。 这种经验强调了我对导师的承诺

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。