利用“設備” AI的力量:建立個人聊天機器人CLI
在最近的過去,個人AI助手的概念似乎是科幻小說。想像一下,科技愛好者亞歷克斯(Alex)夢想著一個聰明的本地AI伴侶 - 不依賴雲服務或外部服務器。多虧了小語言模型(SLM)的進步,Alex的夢想現在是現實。本文指導您使用Alex使用Huggingface的Smollm,Langchain的靈活性和Typer的用戶友好界面來創建AI CHAT CLI應用程序的旅程。您將建立一個功能性的AI助手,能夠在終端中聊天,回答問題和節省對話。讓我們來探索設備AI的世界!
關鍵學習目標:
- 掌握擁抱面Smollm型號的功能和應用。
- 利用SLM型號用於設備AI應用程序。
- 在SLM體系結構中探索分組的疑問注意力(GQA)。
- 使用TYPER和富圖書館開發交互式CLI應用程序。
- 將擁抱面模型與Langchain集成,以進行健壯的AI應用。
目錄:
- 引入HuggingFace Smollm
- 了解分組的疑問(GQA)
- 深入研究GQA
- 利用Smollm
- 探索泰珀
- 實施Typer
- 項目設置
- 構建聊天應用程序
- 常見問題
擁抱面Smollm:近距離看
Smollm是一系列尖端的小語言模型,有三種尺寸(135m,360m和1.7b參數)。這些模型接受了高質量的語料庫(Cosmopedia V2,綜合教科書,教育Python樣本和教育網絡數據)的培訓,這些模型以與常識性推理和世界知識相關的基準表現出色,根據擁抱面的大小類別中的其他模型優於其他模型。
性能比較:
主題分佈:
135m和360m的參數模型利用類似Mobillm的架構,結合了GQA並優先考慮深度超過寬度。
分組疑問(GQA):效率重新定義
注意機制有多種形式:
- 多頭注意力(MHA):每個頭部都有獨立的查詢,鑰匙和價值頭 - 計算昂貴。
- 多傳奇注意(MQA):分享鑰匙和價值頭,但每個頭保持著自己的查詢 - 比MHA更有效。
- 分組質量注意(GQA):小組注意力頭,分組中的鑰匙和價值頭部共享 - 優化速度和效率。將其視為一個合作的團隊,共享資源以提高生產率。
詳細了解GQA
GQA通過對注意力頭進行分組,在每個組中共享密鑰和價值頭來提高處理效率。這與傳統方法形成鮮明對比,每個方法都有自己的鑰匙和值。
主要注意事項:
- GQA-G:與G組的GQA。
- GQS-1:類似於MQA的單組情況。
- GQA-H:組的數量等於注意力頭的數量,類似於MHA。
GQA的好處:
- 提高速度:加工更快,尤其是在大型模型中。
- 提高效率:減少數據處理,節省內存和處理能力。
- 最佳平衡:在速度和準確性之間取得平衡。
與Smollm一起工作
使用PIP安裝Pytorch和變壓器:
PIP安裝火炬變壓器
以下代碼段(將放置在main.py
中)使用SMOLLM-360M教學模型(您可以適應其他尺寸):
從變形金剛導入AutomodelForCausAllm,AutoTokenizer checkpoint =“ huggingfacetb/smollm-360m構造” #...(與原始文章一樣的其餘代碼)
示例輸出:
(繼續使用其餘部分 - 型,項目設置,實現聊天應用程序以及FAQ - 遵循原始文章的結構和內容,調整措辭和句子結構,以改善流量和清晰度,同時保持原始含義。)
以上是如何使用Huggingface Smollm建立個人AI助手的詳細內容。更多資訊請關注PHP中文網其他相關文章!

自2008年以來,我一直倡導這輛共享乘車麵包車,即後來被稱為“ Robotjitney”,後來是“ Vansit”,這是城市運輸的未來。 我預見這些車輛是21世紀的下一代過境解決方案Surpas

革新結帳體驗 Sam's Club的創新性“ Just Go”系統建立在其現有的AI驅動“掃描和GO”技術的基礎上,使會員可以在購物旅行期間通過Sam's Club應用程序進行掃描。

NVIDIA在GTC 2025上的增強可預測性和新產品陣容 NVIDIA是AI基礎架構的關鍵參與者,正在專注於提高其客戶的可預測性。 這涉及一致的產品交付,達到績效期望以及

Google的Gemma 2:強大,高效的語言模型 Google的Gemma語言模型家族以效率和性能而慶祝,隨著Gemma 2的到來而擴展。此最新版本包括兩種模型:270億個參數VER

這一領先的數據劇集以數據科學家,天體物理學家和TEDX演講者Kirk Borne博士為特色。 Borne博士是大數據,AI和機器學習的著名專家,為當前狀態和未來的Traje提供了寶貴的見解

這次演講中出現了一些非常有見地的觀點——關於工程學的背景信息,這些信息向我們展示了為什麼人工智能如此擅長支持人們的體育鍛煉。 我將從每位貢獻者的觀點中概括出一個核心思想,以展示三個設計方面,這些方面是我們探索人工智能在體育運動中應用的重要組成部分。 邊緣設備和原始個人數據 關於人工智能的這個想法實際上包含兩個組成部分——一個與我們放置大型語言模型的位置有關,另一個與我們人類語言和我們的生命體徵在實時測量時“表達”的語言之間的差異有關。 Alexander Amini 對跑步和網球都很了解,但他還

卡特彼勒(Caterpillar)的首席信息官兼高級副總裁傑米·恩格斯特(Jamie Engstrom)領導了一支由28個國家 /地區的2200多名IT專業人員組成的全球團隊。 在卡特彼勒(Caterpillar)工作了26年,其中包括她目前的四年半,Engst

Google Photos的新Ultra HDR工具:快速指南 使用Google Photos的新型Ultra HDR工具增強照片,將標準圖像轉換為充滿活力的高動態範圍傑作。對於社交媒體而言,此工具可提高任何照片的影響,


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

禪工作室 13.0.1
強大的PHP整合開發環境

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。