搜尋
首頁科技週邊人工智慧Zephyr-7B的綜合指南:功能,用法和微調

探索Zephyr-7B:強大的開源LLM

> OpenAI LLM排行榜嗡嗡作響,旨在競爭GPT-4的新開源車型,而Zephyr-7B是一個出色的競爭者。本教程從WebPilot.ai探索了這種尖端語言模型,展示了它與變形金剛管道的使用,並在代理 - 教學數據集上進行了微調。 AI的新手? AI基礎知識技能軌道是一個很好的起點。

了解Zephyr-7b

Zephyr系列的一部分

Zephyr-7b經過訓練,可以充當有益的助手。它的優勢在於生成連貫的文本,翻譯語言,總結信息,情感分析和上下文感知的問題回答。

Zephyr-7b-β:微調的漫威

該系列中的第二個模型是 Zephyr-7b-β是一個微調的Mistral-7b模型。 在公共和合成數據集的混合物中,使用直接偏好優化(DPO)培訓,它擅長解釋複雜的查詢並彙總冗長的文本。 在發行時,它在MT-Bench和Alpacaeval基準測試的7B聊天模型中排名第一。 通過Zephyr Chat上的免費演示測試其功能。

來自Zephyr Chat Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

> >使用擁抱的臉型變壓器訪問Zephyr-7b

>本教程使用擁抱的臉部變壓器來輕鬆訪問。 (如果遇到加載問題,請諮詢推理Kaggle筆記本。

>

安裝庫:

確保您有最新版本:>
  1. >導入庫:
!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes
  1. 創建管道:
import torch
from transformers import pipeline
利用多個GPU進行更快的生成。
    提供更快的計算和減少的內存使用情況(但精度略低)。 >
  1. device_map="auto"torch.bfloat16生成文本:
  2. 下面的示例演示了生成python代碼。
model_name = "HuggingFaceH4/zephyr-7b-beta"

pipe = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])
系統提示:

使用Zephyr-7B樣式系統提示自定義響應:> Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

  1. 自定義數據集上的微調Zephyr-7b
  2. >本節使用Kaggle的Free GPU(大約2小時)在自定義數據集上進行微調Zephyr-7b-Beta。 (有關故障排除的微調Kaggle筆記本。)
>

>設置並準備環境

  1. 安裝庫:
!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes
  1. 導入模塊:
import torch
from transformers import pipeline
  1. > kaggle秘密(對於kaggle筆記本):檢索擁抱的臉和偏見和偏見API鍵。

  2. 擁抱面部和重量和偏見登錄:>

model_name = "HuggingFaceH4/zephyr-7b-beta"

pipe = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

    定義模型和數據集名稱:
  1. >
> Agentinstruct DataSet處理
prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

函數將數據集適應Zephyr-7b的及時樣式。

format_prompt

messages = [
    {
        "role": "system",
        "content": "You are a skilled software engineer who consistently produces high-quality Python code.",
    },
    {
        "role": "user",
        "content": "Write a Python code to display text in a star pattern.",
    },
]

prompt = pipe.tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >加載和準備模型

具有4位精度的

>
    負載模型:
  1. 這對於有限的VRAM的GPU有效培訓至關重要。
%%capture
%pip install -U bitsandbytes
%pip install -U transformers
%pip install -U peft
%pip install -U accelerate
%pip install -U trl
    >加載tokenizer:
# ... (Import statements as in original tutorial) ...
    添加適配器層(peft):
  1. >這允許僅通過更新適配器層中的參數來進行有效的微調。 >
訓練模型
!huggingface-cli login --token $secret_hf
# ... (wandb login as in original tutorial) ...

>
    培訓參數:
  1. >配置超參數(請參閱微調千層面2教程)。
base_model = "HuggingFaceH4/zephyr-7b-beta"
dataset_name = "THUDM/AgentInstruct"
new_model = "zephyr-7b-beta-Agent-Instruct"
    SFT培訓師:
  1. 使用擁抱Face的TRL庫來創建教練。 >
# ... (format_prompt function and dataset loading as in original tutorial) ...
開始訓練:
# ... (bnb_config and model loading as in original tutorial) ...

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >保存和部署微調模型Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

保存模型:
推到擁抱麵線:
# ... (tokenizer loading and configuration as in original tutorial) ...
    >
# ... (peft_config and model preparation as in original tutorial) ...

測試微型模型Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >用各種提示測試模型的性能。原始教程中提供了示例。

>

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

結論

> Zephyr-7b-beta表現出令人印象深刻的功能。本教程為即使在資源受限的GPU上,也提供了利用和微調這一強大的LLM的綜合指南。 考慮大型語言模型(LLMS)概念課程,以了解更深的LLM知識。

以上是Zephyr-7B的綜合指南:功能,用法和微調的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
META的新AI助手:生產力助推器還是時間下沉?META的新AI助手:生產力助推器還是時間下沉?May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

80%的Zers將嫁給AI:研究80%的Zers將嫁給AI:研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

賣給機器人:將創造或破壞業務的營銷革命賣給機器人:將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

AI如何加速再生醫學的未來AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

AI出了問題嗎?現在在那里為此保險AI出了問題嗎?現在在那里為此保險May 01, 2025 am 11:11 AM

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),