> Torchchat:將大型語言模型推理到您的本地計算機
> 大型語言模型(LLM)正在轉換技術,但是由於硬件限制,將它們部署在個人設備上一直具有挑戰性。 Pytorch的新Torchchat Framework解決了這一點,從筆記本電腦到移動設備,可以在各種硬件平台上有效地執行LLM。 本文提供了一個實用的指南,可以在本地使用Python進行設置和使用Torchchat。 Facebook的AI Research Lab(公平)開源機器學習框架,Bunderpins Torchchat。 它的多功能性擴展到計算機視覺和自然語言處理。> Torchchat的關鍵特徵:
> Torchchat提供四個核心功能:
> python/pytorch llm執行:
- 自包含的模型部署:使用AOT電感器(提前電感器),Torchchat創建了獨立於Python和Pytorch的獨立的可執行文件(動態庫)。這樣可以確保在生產環境中穩定的模型運行時,而無需重新編譯。 AOT電感器通過有效的二進制格式優化部署,超過了火炬的開銷。
- >移動設備執行:利用executorch,Torchchat優化了移動設備和嵌入式設備的模型,生成了執行的PTE工件。
> - 模型評估:>使用框架評估LLM性能,對研究和基準測試至關重要。
- 為什麼在本地運行llms? >
當地LLM執行提供了幾個優點:
lm_eval
增強的隱私:
實時性能:
最大程度地減少需要快速響應的應用程序的延遲,例如Interactive聊天機器人和實時內容生成。- >
- 脫機功能:在有限或沒有互聯網連接的區域中啟用LLM使用。
- 成本優化:比雲API的成本效益更高 python的本地設置:逐步指南
- > >
- 克隆存儲庫:使用git克隆torchchat存儲庫:
>
-
>
>安裝:git clone git@github.com:pytorch/torchchat.git
假設安裝了Python 3.10,創建一個虛擬環境:> -
使用Torchchat:
-
>列表支持的模型:
python -m venv .venv source .venv/bin/activate
-
下載模型:
安裝擁抱面CLI(),創建一個擁抱的臉部帳戶,生成訪問令牌,然後登錄( )。下載模型(例如, ):pip install huggingface_hub
>huggingface-cli login
stories15M
./install_requirements.sh
> 運行模型: - 生成文本:
> 或使用聊天模式:
python torchchat.py --help
python torchchat.py list
>請求訪問: 對於需要訪問的模型(例如, - ),請按照錯誤消息中的說明進行操作。
llama3
高級用法:微調性能
-
git clone git@github.com:pytorch/torchchat.git
精確控制(
):- 調整速度/準確性權衡的數據類型(例如,
- )。
--dtype
just-In-time(JIT)彙編():--dtype fast
>提高推理速度(但增加了啟動時間)。 - 量化():
--compile
使用JSON配置文件降低模型大小並提高速度。 - >設備規範():
--quantize
指定設備(例如,)。 -
結論
--device
> Torchchat簡化了本地LLM執行,使高級AI更容易訪問。本指南為探索其功能提供了基礎。 強烈建議對Torchchat的特徵進行進一步研究。
以上是Pytorch' torchchat教程:與Python的本地設置的詳細內容。更多資訊請關注PHP中文網其他相關文章!

由於AI的快速整合而加劇了工作場所的迅速危機危機,要求戰略轉變以外的增量調整。 WTI的調查結果強調了這一點:68%的員工在工作量上掙扎,導致BUR

約翰·塞爾(John Searle)的中國房間論點:對AI理解的挑戰 Searle的思想實驗直接質疑人工智能是否可以真正理解語言或具有真正意識。 想像一個人,對下巴一無所知

與西方同行相比,中國的科技巨頭在AI開發方面的課程不同。 他們不專注於技術基準和API集成,而是優先考慮“屏幕感知” AI助手 - AI T

MCP:賦能AI系統訪問外部工具 模型上下文協議(MCP)讓AI應用能夠通過標準化接口與外部工具和數據源交互。由Anthropic開發並得到主要AI提供商的支持,MCP允許語言模型和智能體發現可用工具並使用合適的參數調用它們。然而,實施MCP服務器存在一些挑戰,包括環境衝突、安全漏洞以及跨平台行為不一致。 Forbes文章《Anthropic的模型上下文協議是AI智能體發展的一大步》作者:Janakiram MSVDocker通過容器化解決了這些問題。基於Docker Hub基礎設施構建的Doc

有遠見的企業家採用的六種策略,他們利用尖端技術和精明的商業敏銳度來創造高利潤的可擴展公司,同時保持控制。本指南是針對有抱負的企業家的,旨在建立一個

Google Photos的新型Ultra HDR工具:改變圖像增強的遊戲規則 Google Photos推出了一個功能強大的Ultra HDR轉換工具,將標準照片轉換為充滿活力的高動態範圍圖像。這種增強功能受益於攝影師

技術架構解決了新興的身份驗證挑戰 代理身份集線器解決了許多組織僅在開始AI代理實施後發現的問題,即傳統身份驗證方法不是為機器設計的

(注意:Google是我公司的諮詢客戶,Moor Insights&Strateging。) AI:從實驗到企業基金會 Google Cloud Next 2025展示了AI從實驗功能到企業技術的核心組成部分的演變,


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 Linux新版
SublimeText3 Linux最新版

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。