Zephyr-7B的綜合指南：功能，用法和微調-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

Zephyr-7B的綜合指南：功能，用法和微調

Jennifer Aniston

Mar 08, 2025 am 09:55 AM

探索Zephyr-7B：強大的開源LLM

> OpenAI LLM排行榜嗡嗡作響，旨在競爭GPT-4的新開源車型，而Zephyr-7B是一個出色的競爭者。本教程從WebPilot.ai探索了這種尖端語言模型，展示了它與變形金剛管道的使用，並在代理 - 教學數據集上進行了微調。 AI的新手？ AI基礎知識技能軌道是一個很好的起點。

了解Zephyr-7b

Zephyr系列的一部分

Zephyr-7b經過訓練，可以充當有益的助手。它的優勢在於生成連貫的文本，翻譯語言，總結信息，情感分析和上下文感知的問題回答。

Zephyr-7b-β：微調的漫威

該系列中的第二個模型是 Zephyr-7b-β是一個微調的Mistral-7b模型。在公共和合成數據集的混合物中，使用直接偏好優化（DPO）培訓，它擅長解釋複雜的查詢並彙總冗長的文本。在發行時，它在MT-Bench和Alpacaeval基準測試的7B聊天模型中排名第一。通過Zephyr Chat上的免費演示測試其功能。

來自Zephyr Chat Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

> >使用擁抱的臉型變壓器訪問Zephyr-7b

>本教程使用擁抱的臉部變壓器來輕鬆訪問。（如果遇到加載問題，請諮詢推理Kaggle筆記本。

安裝庫：

確保您有最新版本：>

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

import torch
from transformers import pipeline

利用多個GPU進行更快的生成。

device_map="auto"torch.bfloat16生成文本：

下面的示例演示了生成python代碼。

model_name = "HuggingFaceH4/zephyr-7b-beta"

pipe = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

系統提示：

使用Zephyr-7B樣式系統提示自定義響應：> Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

自定義數據集上的微調Zephyr-7b

>設置並準備環境

安裝庫：

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

導入模塊：

import torch
from transformers import pipeline

> kaggle秘密（對於kaggle筆記本）：檢索擁抱的臉和偏見和偏見API鍵。
擁抱面部和重量和偏見登錄：>

model_name = "HuggingFaceH4/zephyr-7b-beta"

pipe = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

> Agentinstruct DataSet處理

prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

函數將數據集適應Zephyr-7b的及時樣式。

format_prompt

messages = [
    {
        "role": "system",
        "content": "You are a skilled software engineer who consistently produces high-quality Python code.",
    },
    {
        "role": "user",
        "content": "Write a Python code to display text in a star pattern.",
    },
]

prompt = pipe.tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >加載和準備模型

具有4位精度的

這對於有限的VRAM的GPU有效培訓至關重要。

%%capture
%pip install -U bitsandbytes
%pip install -U transformers
%pip install -U peft
%pip install -U accelerate
%pip install -U trl

# ... (Import statements as in original tutorial) ...

>這允許僅通過更新適配器層中的參數來進行有效的微調。 >

訓練模型

!huggingface-cli login --token $secret_hf
# ... (wandb login as in original tutorial) ...

>配置超參數（請參閱微調千層面2教程）。

base_model = "HuggingFaceH4/zephyr-7b-beta"
dataset_name = "THUDM/AgentInstruct"
new_model = "zephyr-7b-beta-Agent-Instruct"

使用擁抱Face的TRL庫來創建教練。 >

# ... (format_prompt function and dataset loading as in original tutorial) ...

開始訓練：

# ... (bnb_config and model loading as in original tutorial) ...

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >保存和部署微調模型

保存模型：

推到擁抱麵線：

# ... (tokenizer loading and configuration as in original tutorial) ...

# ... (peft_config and model preparation as in original tutorial) ...

測試微型模型 Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >用各種提示測試模型的性能。原始教程中提供了示例。

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

結論

> Zephyr-7b-beta表現出令人印象深刻的功能。本教程為即使在資源受限的GPU上，也提供了利用和微調這一強大的LLM的綜合指南。考慮大型語言模型（LLMS）概念課程，以了解更深的LLM知識。

以上是Zephyr-7B的綜合指南：功能，用法和微調的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

META的新AI助手：生產力助推器還是時間下沉？May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴，拓展了Llama Stack的企業級部署整合。在安全方面，Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具，並啟動了Llama Defenders計劃，以增強AI安全性。此外，Meta還向10個全球機構（包括致力於改善公共服務、醫療保健和教育的初創企業）發放了總額150萬美元的Llama Impact Grants。由Llama 4驅動的全新Meta AI應用，被設想為Meta AI

80％的Zers將嫁給AI：研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說，這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。零售商與機器人ho積產品，銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題，Rende

賣給機器人：將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷，並可能超過以前技術轉變的影響。這些代理代表了生成AI的重大進步，不僅是處理諸如chatgpt之類的處理信息，而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。首先，丹佛的尼古拉·喬基奇（Nikola Jokic）錯過了三分球，導致亞倫·戈登（Aaron Gordon）的最後一秒鐘。索尼的鷹

AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上，擴大重生醫學專業知識在全球範圍內要求廣泛的旅行，動手培訓和多年指導。現在，AI正在改變這一景觀，克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位，同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此，英特爾必須在業界建立更多信任，不僅要證明其工藝的競爭力，還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰，以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程，以更以客