探索Zephyr-7B:强大的开源LLM
> OpenAI LLM排行榜嗡嗡作响,旨在竞争GPT-4的新开源车型,而Zephyr-7B是一个出色的竞争者。本教程从WebPilot.ai探索了这种尖端语言模型,展示了它与变形金刚管道的使用,并在代理 - 教学数据集上进行了微调。 AI的新手? AI基础知识技能轨道是一个很好的起点。
了解Zephyr-7b
Zephyr系列的一部分Zephyr-7b经过训练,可以充当有益的助手。它的优势在于生成连贯的文本,翻译语言,总结信息,情感分析和上下文感知的问题回答。
Zephyr-7b-β:微调的漫威
该系列中的第二个模型是 Zephyr-7b-β是一个微调的Mistral-7b模型。 在公共和合成数据集的混合物中,使用直接偏好优化(DPO)培训,它擅长解释复杂的查询并汇总冗长的文本。 在发行时,它在MT-Bench和Alpacaeval基准测试的7B聊天模型中排名第一。 通过Zephyr Chat上的免费演示测试其功能。
来自Zephyr Chat
> >使用拥抱的脸型变压器访问Zephyr-7b
>本教程使用拥抱的脸部变压器来轻松访问。 (如果遇到加载问题,请咨询推理Kaggle笔记本。>
安装库:
确保您有最新版本:- >导入库:
!pip install -q -U transformers !pip install -q -U accelerate !pip install -q -U bitsandbytes
- 创建管道:
import torch from transformers import pipeline利用多个GPU进行更快的生成。
- 提供更快的计算和减少的内存使用情况(但精度略低)。
-
device_map="auto"
torch.bfloat16
生成文本: 下面的示例演示了生成python代码。
model_name = "HuggingFaceH4/zephyr-7b-beta" pipe = pipeline( "text-generation", model=model_name, torch_dtype=torch.bfloat16, device_map="auto", )
prompt = "Write a Python function that can clean the HTML tags from the file:" outputs = pipe( prompt, max_new_tokens=300, do_sample=True, temperature=0.7, top_k=50, top_p=0.95, ) print(outputs[0]["generated_text"])系统提示:
使用Zephyr-7B样式系统提示自定义响应:
-
自定义数据集上的微调Zephyr-7b
>设置并准备环境
- 安装库:
!pip install -q -U transformers !pip install -q -U accelerate !pip install -q -U bitsandbytes
-
导入模块:
import torch from transformers import pipeline
-
> kaggle秘密(对于kaggle笔记本):检索拥抱的脸和偏见和偏见API键。
-
拥抱面部和重量和偏见登录:
>
model_name = "HuggingFaceH4/zephyr-7b-beta" pipe = pipeline( "text-generation", model=model_name, torch_dtype=torch.bfloat16, device_map="auto", )
- 定义模型和数据集名称:
- >
prompt = "Write a Python function that can clean the HTML tags from the file:" outputs = pipe( prompt, max_new_tokens=300, do_sample=True, temperature=0.7, top_k=50, top_p=0.95, ) print(outputs[0]["generated_text"])函数将数据集适应Zephyr-7b的及时样式。
format_prompt
messages = [ { "role": "system", "content": "You are a skilled software engineer who consistently produces high-quality Python code.", }, { "role": "user", "content": "Write a Python code to display text in a star pattern.", }, ] prompt = pipe.tokenizer.apply_chat_template( messages, tokenize=False, add_generation_prompt=True ) outputs = pipe( prompt, max_new_tokens=300, do_sample=True, temperature=0.7, top_k=50, top_p=0.95, ) print(outputs[0]["generated_text"])
>加载和准备模型
具有4位精度的
>- 负载模型:
- 这对于有限的VRAM的GPU有效培训至关重要。
%%capture %pip install -U bitsandbytes %pip install -U transformers %pip install -U peft %pip install -U accelerate %pip install -U trl
- >加载tokenizer:
# ... (Import statements as in original tutorial) ...
- 添加适配器层(peft):
- >这允许仅通过更新适配器层中的参数来进行有效的微调。>
!huggingface-cli login --token $secret_hf # ... (wandb login as in original tutorial) ...
>
- 培训参数:
- >配置超参数(请参阅微调千层面2教程)。
base_model = "HuggingFaceH4/zephyr-7b-beta" dataset_name = "THUDM/AgentInstruct" new_model = "zephyr-7b-beta-Agent-Instruct"
- SFT培训师:
- 使用拥抱Face的TRL库来创建教练。
>
# ... (format_prompt function and dataset loading as in original tutorial) ...开始训练:
# ... (bnb_config and model loading as in original tutorial) ...
>保存和部署微调模型
# ... (tokenizer loading and configuration as in original tutorial) ...
- >
# ... (peft_config and model preparation as in original tutorial) ...
测试微型模型
>用各种提示测试模型的性能。原始教程中提供了示例。
结论
> Zephyr-7b-beta表现出令人印象深刻的功能。本教程为即使在资源受限的GPU上,也提供了利用和微调这一强大的LLM的综合指南。 考虑大型语言模型(LLMS)概念课程,以了解更深的LLM知识。
以上是Zephyr-7B的综合指南:功能,用法和微调的详细内容。更多信息请关注PHP中文网其他相关文章!

Meta携手Nvidia、IBM和Dell等合作伙伴,拓展了Llama Stack的企业级部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,并启动了Llama Defenders计划,以增强AI安全性。此外,Meta还向10个全球机构(包括致力于改善公共服务、医疗保健和教育的初创企业)发放了总额150万美元的Llama Impact Grants。 由Llama 4驱动的全新Meta AI应用,被设想为Meta AI

公司开创性的人类互动公司Joi AI介绍了“ AI-Iatsionship”一词来描述这些不断发展的关系。 Joi AI的关系治疗师Jaime Bronstein澄清说,这并不是要取代人类C

在线欺诈和机器人攻击对企业构成了重大挑战。 零售商与机器人ho积产品,银行战斗帐户收购和社交媒体平台与模仿者的斗争。 AI的兴起加剧了这个问题,Rende

AI代理人有望彻底改变营销,并可能超过以前技术转变的影响。 这些代理代表了生成AI的重大进步,不仅是处理诸如chatgpt之类的处理信息,而且还采取了Actio

人工智能对关键NBA游戏4决策的影响 两场关键游戏4 NBA对决展示了AI在主持仪式中改变游戏规则的角色。 首先,丹佛的尼古拉·乔基奇(Nikola Jokic)错过了三分球,导致亚伦·戈登(Aaron Gordon)的最后一秒钟。 索尼的鹰

传统上,扩大重生医学专业知识在全球范围内要求广泛的旅行,动手培训和多年指导。 现在,AI正在改变这一景观,克服地理局限性并通过EN加速进步

英特尔正努力使其制造工艺重回领先地位,同时努力吸引无晶圆厂半导体客户在其晶圆厂制造芯片。为此,英特尔必须在业界建立更多信任,不仅要证明其工艺的竞争力,还要证明合作伙伴能够以熟悉且成熟的工作流程、一致且高可靠性地制造芯片。今天我听到的一切都让我相信英特尔正在朝着这个目标前进。 新任首席执行官谭立柏的主题演讲拉开了当天的序幕。谭立柏直率而简洁。他概述了英特尔代工服务的若干挑战,以及公司为应对这些挑战、为英特尔代工服务的未来规划成功路线而采取的措施。谭立柏谈到了英特尔代工服务正在实施的流程,以更以客

全球专业再保险公司Chaucer Group和Armilla AI解决了围绕AI风险的日益严重的问题,已联手引入了新型的第三方责任(TPL)保险产品。 该政策保护业务不利


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

Atom编辑器mac版下载
最流行的的开源编辑器

SublimeText3汉化版
中文版,非常好用

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境