搜尋
首頁科技週邊人工智慧微調美洲駝3.2並在本地使用:逐步指南

解鎖駱駝的力量3.2:綜合指南和本地部署

大語模型(LLM)的景觀正在迅速發展,重點是較小,更有效的模型。 Llama 3.2憑藉其輕巧和視力模型的變化體現了這一趨勢。本教程詳細介紹瞭如何利用Llama 3.2的功能,特別是3B輕型模型,用於在客戶支持數據集上進行微調以及使用JAN應用程序進行的本地部署。 在潛水之前,強烈鼓勵初學者完成AI基礎知識課程,以掌握LLM和生成AI的基礎。

>作者的圖像

Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide 探索駱駝3.2型號

Llama 3.2提供了兩個模型系列:輕量級和視野。輕巧的模型在多語言文本生成和工具使用方面表現出色,非常適合資源受限環境。另一方面,視覺模型專門研究圖像推理和多模式任務。

輕量級模型

輕巧的家族包括1B和3B參數變體。 它們的緊湊型尺寸允許進行設備處理,確保數據隱私和快速,成本效益的文本生成。 這些模型利用修剪和知識蒸餾來提高效率和性能。 3B模型超過了諸如Gemma 2和Phi 3.5-Mini之類的競爭對手,例如諸如教學和摘要之類的任務。

>

來源:Llama 3.2:用開放的,可自定義的模型革命性的邊緣AI和視覺

視覺模型

Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide 視覺模型(11b和90b參數)是為圖像推理而設計的,能夠解釋文檔和圖表。 它們的多模式能力源於將預訓練的圖像編碼與語言模型集成在一起。 在視覺理解任務中,他們的表現優於克勞德3 haiku和gpt-4o mini。

來源:Llama 3.2:用開放的,可自定義的模型革命性的邊緣AI和視覺

以深入了解Llama 3.2的架構,基準和安全功能(Llama Guard 3),請參閱《官方Llama 3.2指南》。

>在Kaggle上訪問Llama 3.2

雖然Llama 3.2是開源的,但訪問需要接受條款和條件。 這是通過kaggle訪問它的方法:Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide

  1. >請訪問llama.com,填寫訪問表格,選擇輕量級和視覺模型。
  2. >導航到元| Llama 3.2型號頁面上的型號並提交表格。
  3. 接受條款和條件。
  4. 等待筆記本創建選項。 選擇“變形金剛”選項卡,選擇您的模型變體,然後創建一個新的筆記本。
  5. 將加速器配置為“ gpu t4 x2”。
  6. >
  7. >使用
  8. transformers隨後的步驟涉及使用accelerate庫庫加載令牌和模型,指定本地模型目錄,設置%pip install -U transformers accelerate,創建文本生成管道以及使用自定義提示的運行推斷。 隨附的Kaggle筆記本中提供了詳細的代碼示例。 類似的步驟適用於訪問Llama 3.2視覺模型,儘管GPU要求明顯更高。
  9. >微調美洲駝3.2 3b指示

>本節通過微調Llama 3.2 3B指示模型在客戶支持數據集上使用transformers library和Qlora進行有效培訓。

>設置

  1. 啟動一個新的Kaggle筆記本和設置環境變量,用於擁抱面部和重量和偏見(WANDB)訪問。
  2. 安裝必要的軟件包:transformersdatasetsacceleratepefttrlbitsandbyteswandb
  3. >使用您的API鍵登錄以擁抱臉和魔杖。
  4. >
  5. >定義基本模型,新模型名稱和數據集名稱的變量。
加載模型和令牌

    根據您的GPU功能確定適當的
  1. >>>>。 torch_dtype>使用attn_implementation進行4位量化的模型以最大程度地減少內存使用情況。
  2. >
  3. 加載令牌。 BitsAndBytesConfig
  4. 加載和處理數據集

>加載

  1. 洗牌並選擇數據的子集(例如,1000個樣本以進行更快的培訓)。 bitext/Bitext-customer-support-llm-chatbot-training-dataset
  2. >通過將系統指令,用戶查詢和助手響應組合到聊天格式中,創建一個“文本”列。
  3. 設置模型
  4. apply_chat_template
  5. >使用輔助函數識別所有線性模塊名稱。

使用

    對lora進行配置。
  1. >設置
  2. ,並使用適當的超參數來進行高效培訓。 LoraConfig
  3. 創建一個
  4. 實例,提供模型,數據集,洛拉配置,培訓參數和令牌。 TrainingArguments>
  5. 模型培訓SFTTrainer
  6. 使用
訓練模型。 使用WANDB進行監視培訓和驗證損失。

模型推理

trainer.train()>測試使用數據集中的示例提示的微調模型。

>

保存模型

>在本地保存微調模型,然後將其推到擁抱的臉上輪轂。

合併和導出微調模型

>本節詳細介紹了將微調的洛拉適配器與基本型號合併,並將其導出到擁抱的面輪。 它涉及加載基本模型和洛拉適配器,使用

>和

合併它們,然後保存並將合併模型推到集線器。

>轉換為gguf和本地部署

最後,教程將使用GGGUF我的回購工具在擁抱臉部和使用JAN應用程序本地部署它時將合併模型轉換為GGGUF格式。 這涉及下載GGUF文件,將其導入JAN,並設置系統提示並停止令牌以獲得最佳性能。 >

結論

微調較小的LLMS為定制特定任務的模型提供了一種經濟高效且有效的方法。 本教程提供了一個實用指南,以利用Llama 3.2的功能,從訪問和微調到本地部署,使用戶能夠構建和部署自定義AI解決方案。 切記查閱隨附的Kaggle筆記本以獲取詳細的代碼示例。

以上是微調美洲駝3.2並在本地使用:逐步指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
從摩擦到流:AI如何重塑法律工作從摩擦到流:AI如何重塑法律工作May 09, 2025 am 11:29 AM

法律技術革命正在獲得動力,促使法律專業人員積極採用AI解決方案。 對於那些旨在保持競爭力的人來說,被動抵抗不再是可行的選擇。 為什麼技術採用至關重要? 法律專業人員

這就是AI對您的看法,對您的了解這就是AI對您的看法,對您的了解May 09, 2025 am 11:24 AM

許多人認為與AI的互動是匿名的,與人類交流形成了鮮明的對比。 但是,AI在每次聊天期間都會積極介紹用戶。 每個單詞的每個提示都經過分析和分類。讓我們探索AI Revo的這一關鍵方面

建立蓬勃發展的AI-Ready企業文化的7個步驟建立蓬勃發展的AI-Ready企業文化的7個步驟May 09, 2025 am 11:23 AM

成功的人工智能戰略,離不開強大的企業文化支撐。正如彼得·德魯克所言,企業運作依賴於人,人工智能的成功也同樣如此。 對於積極擁抱人工智能的組織而言,構建適應AI的企業文化至關重要,它甚至決定著AI戰略的成敗。 西蒙諾諮詢公司(West Monroe)近期發布了構建蓬勃發展的AI友好型企業文化的實用指南,以下是一些關鍵要點: 1. 明確AI的成功模式: 首先,要對AI如何賦能業務有清晰的願景。理想的AI運作文化,能夠實現人與AI系統之間工作流程的自然融合。 AI擅長某些任務,而人類則擅長創造力、判

Netflix New Scroll,Meta AI的遊戲規則改變者,Neuralink價值85億美元Netflix New Scroll,Meta AI的遊戲規則改變者,Neuralink價值85億美元May 09, 2025 am 11:22 AM

Meta升級AI助手應用,可穿戴式AI時代來臨!這款旨在與ChatGPT競爭的應用,提供文本、語音交互、圖像生成和網絡搜索等標準AI功能,但現在首次增加了地理位置功能。這意味著Meta AI在回答你的問題時,知道你的位置和正在查看的內容。它利用你的興趣、位置、個人資料和活動信息,提供最新的情境信息,這在以前是無法實現的。該應用還支持實時翻譯,這徹底改變了Ray-Ban眼鏡上的AI體驗,使其實用性大大提升。 對外國電影徵收關稅是對媒體和文化的赤裸裸的權力行使。如果實施,這將加速向AI和虛擬製作的

今天採取這些步驟以保護自己免受AI網絡犯罪的侵害今天採取這些步驟以保護自己免受AI網絡犯罪的侵害May 09, 2025 am 11:19 AM

人工智能正在徹底改變網絡犯罪領域,這迫使我們必須學習新的防禦技巧。網絡罪犯日益利用深度偽造和智能網絡攻擊等強大的人工智能技術進行欺詐和破壞,其規模前所未有。據報導,87%的全球企業在過去一年中都成為人工智能網絡犯罪的目標。 那麼,我們該如何避免成為這波智能犯罪的受害者呢?讓我們探討如何在個人和組織層面識別風險並採取防護措施。 網絡罪犯如何利用人工智能 隨著技術的進步,犯罪分子不斷尋找新的方法來攻擊個人、企業和政府。人工智能的廣泛應用可能是最新的一個方面,但其潛在危害是前所未有的。 特別是,人工智

共生舞蹈:人工和自然感知的循環共生舞蹈:人工和自然感知的循環May 09, 2025 am 11:13 AM

最好將人工智能(AI)與人類智力(NI)之間的複雜關係理解為反饋循環。 人類創建AI,對人類活動產生的數據進行培訓,以增強或複制人類能力。 這個AI

AI最大的秘密 - 創作者不了解,專家分裂AI最大的秘密 - 創作者不了解,專家分裂May 09, 2025 am 11:09 AM

Anthropic最近的聲明強調了有關尖端AI模型缺乏了解,引發了專家之間的激烈辯論。 這是一個真正的技術危機,還是僅僅是通往更秘密的道路上的臨時障礙

Sarvam AI的Bulbul-V2:印度最佳TTS模型Sarvam AI的Bulbul-V2:印度最佳TTS模型May 09, 2025 am 10:52 AM

印度是一個多元化的國家,具有豐富的語言,使整個地區的無縫溝通成為持續的挑戰。但是,Sarvam的Bulbul-V2正在幫助彌合其高級文本到語音(TTS)T

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!