解鎖駱駝的力量3.2:綜合指南和本地部署
大語模型(LLM)的景觀正在迅速發展,重點是較小,更有效的模型。 Llama 3.2憑藉其輕巧和視力模型的變化體現了這一趨勢。本教程詳細介紹瞭如何利用Llama 3.2的功能,特別是3B輕型模型,用於在客戶支持數據集上進行微調以及使用JAN應用程序進行的本地部署。 在潛水之前,強烈鼓勵初學者完成AI基礎知識課程,以掌握LLM和生成AI的基礎。>作者的圖像
探索駱駝3.2型號
輕量級模型
輕巧的家族包括1B和3B參數變體。 它們的緊湊型尺寸允許進行設備處理,確保數據隱私和快速,成本效益的文本生成。 這些模型利用修剪和知識蒸餾來提高效率和性能。 3B模型超過了諸如Gemma 2和Phi 3.5-Mini之類的競爭對手,例如諸如教學和摘要之類的任務。
>來源:Llama 3.2:用開放的,可自定義的模型革命性的邊緣AI和視覺
視覺模型
視覺模型(11b和90b參數)是為圖像推理而設計的,能夠解釋文檔和圖表。 它們的多模式能力源於將預訓練的圖像編碼與語言模型集成在一起。 在視覺理解任務中,他們的表現優於克勞德3 haiku和gpt-4o mini。
來源:Llama 3.2:用開放的,可自定義的模型革命性的邊緣AI和視覺
以深入了解Llama 3.2的架構,基準和安全功能(Llama Guard 3),請參閱《官方Llama 3.2指南》。
>在Kaggle上訪問Llama 3.2雖然Llama 3.2是開源的,但訪問需要接受條款和條件。 這是通過kaggle訪問它的方法:
- >請訪問llama.com,填寫訪問表格,選擇輕量級和視覺模型。 >導航到元| Llama 3.2型號頁面上的型號並提交表格。
- 接受條款和條件。
- 等待筆記本創建選項。 選擇“變形金剛”選項卡,選擇您的模型變體,然後創建一個新的筆記本。
- 將加速器配置為“ gpu t4 x2”。 >
- >使用 。
-
transformers
隨後的步驟涉及使用accelerate
庫庫加載令牌和模型,指定本地模型目錄,設置%pip install -U transformers accelerate
,創建文本生成管道以及使用自定義提示的運行推斷。 隨附的Kaggle筆記本中提供了詳細的代碼示例。 類似的步驟適用於訪問Llama 3.2視覺模型,儘管GPU要求明顯更高。 >微調美洲駝3.2 3b指示
>本節通過微調Llama 3.2 3B指示模型在客戶支持數據集上使用transformers
library和Qlora進行有效培訓。
>設置
- 啟動一個新的Kaggle筆記本和設置環境變量,用於擁抱面部和重量和偏見(WANDB)訪問。
- 安裝必要的軟件包:
transformers
,datasets
,accelerate
,peft
,trl
,bitsandbytes
,wandb
和 。
- >使用您的API鍵登錄以擁抱臉和魔杖。 >
- >定義基本模型,新模型名稱和數據集名稱的變量。
- 根據您的GPU功能確定適當的
- >>>>。
torch_dtype
>使用attn_implementation
進行4位量化的模型以最大程度地減少內存使用情況。 >
- 加載令牌。
BitsAndBytesConfig
- 加載和處理數據集
>加載
。- 洗牌並選擇數據的子集(例如,1000個樣本以進行更快的培訓)。
bitext/Bitext-customer-support-llm-chatbot-training-dataset
>通過將系統指令,用戶查詢和助手響應組合到聊天格式中,創建一個“文本”列。
- 設置模型
-
apply_chat_template
>使用輔助函數識別所有線性模塊名稱。
使用
- 對lora進行配置。
- >設置
- ,並使用適當的超參數來進行高效培訓。
LoraConfig
創建一個 - 實例,提供模型,數據集,洛拉配置,培訓參數和令牌。
TrainingArguments
> - 模型培訓
SFTTrainer
使用
模型推理
trainer.train()
>測試使用數據集中的示例提示的微調模型。
保存模型
>在本地保存微調模型,然後將其推到擁抱的臉上輪轂。
合併和導出微調模型>本節詳細介紹了將微調的洛拉適配器與基本型號合併,並將其導出到擁抱的面輪。 它涉及加載基本模型和洛拉適配器,使用
>和
合併它們,然後保存並將合併模型推到集線器。>轉換為gguf和本地部署
最後,教程將使用GGGUF我的回購工具在擁抱臉部和使用JAN應用程序本地部署它時將合併模型轉換為GGGUF格式。 這涉及下載GGUF文件,將其導入JAN,並設置系統提示並停止令牌以獲得最佳性能。結論
以上是微調美洲駝3.2並在本地使用:逐步指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

法律技術革命正在獲得動力,促使法律專業人員積極採用AI解決方案。 對於那些旨在保持競爭力的人來說,被動抵抗不再是可行的選擇。 為什麼技術採用至關重要? 法律專業人員

許多人認為與AI的互動是匿名的,與人類交流形成了鮮明的對比。 但是,AI在每次聊天期間都會積極介紹用戶。 每個單詞的每個提示都經過分析和分類。讓我們探索AI Revo的這一關鍵方面

成功的人工智能戰略,離不開強大的企業文化支撐。正如彼得·德魯克所言,企業運作依賴於人,人工智能的成功也同樣如此。 對於積極擁抱人工智能的組織而言,構建適應AI的企業文化至關重要,它甚至決定著AI戰略的成敗。 西蒙諾諮詢公司(West Monroe)近期發布了構建蓬勃發展的AI友好型企業文化的實用指南,以下是一些關鍵要點: 1. 明確AI的成功模式: 首先,要對AI如何賦能業務有清晰的願景。理想的AI運作文化,能夠實現人與AI系統之間工作流程的自然融合。 AI擅長某些任務,而人類則擅長創造力、判

Meta升級AI助手應用,可穿戴式AI時代來臨!這款旨在與ChatGPT競爭的應用,提供文本、語音交互、圖像生成和網絡搜索等標準AI功能,但現在首次增加了地理位置功能。這意味著Meta AI在回答你的問題時,知道你的位置和正在查看的內容。它利用你的興趣、位置、個人資料和活動信息,提供最新的情境信息,這在以前是無法實現的。該應用還支持實時翻譯,這徹底改變了Ray-Ban眼鏡上的AI體驗,使其實用性大大提升。 對外國電影徵收關稅是對媒體和文化的赤裸裸的權力行使。如果實施,這將加速向AI和虛擬製作的

人工智能正在徹底改變網絡犯罪領域,這迫使我們必須學習新的防禦技巧。網絡罪犯日益利用深度偽造和智能網絡攻擊等強大的人工智能技術進行欺詐和破壞,其規模前所未有。據報導,87%的全球企業在過去一年中都成為人工智能網絡犯罪的目標。 那麼,我們該如何避免成為這波智能犯罪的受害者呢?讓我們探討如何在個人和組織層面識別風險並採取防護措施。 網絡罪犯如何利用人工智能 隨著技術的進步,犯罪分子不斷尋找新的方法來攻擊個人、企業和政府。人工智能的廣泛應用可能是最新的一個方面,但其潛在危害是前所未有的。 特別是,人工智

最好將人工智能(AI)與人類智力(NI)之間的複雜關係理解為反饋循環。 人類創建AI,對人類活動產生的數據進行培訓,以增強或複制人類能力。 這個AI

Anthropic最近的聲明強調了有關尖端AI模型缺乏了解,引發了專家之間的激烈辯論。 這是一個真正的技術危機,還是僅僅是通往更秘密的道路上的臨時障礙

印度是一個多元化的國家,具有豐富的語言,使整個地區的無縫溝通成為持續的挑戰。但是,Sarvam的Bulbul-V2正在幫助彌合其高級文本到語音(TTS)T


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

禪工作室 13.0.1
強大的PHP整合開發環境

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!