> Torchchat:将大型语言模型推理到您的本地计算机
> 大型语言模型(LLM)正在转换技术,但是由于硬件限制,将它们部署在个人设备上一直具有挑战性。 Pytorch的新Torchchat Framework解决了这一点,从笔记本电脑到移动设备,可以在各种硬件平台上有效地执行LLM。 本文提供了一个实用的指南,可以在本地使用Python进行设置和使用Torchchat。 Facebook的AI Research Lab(公平)开源机器学习框架,Bunderpins Torchchat。 它的多功能性扩展到计算机视觉和自然语言处理。> Torchchat的关键特征:
> Torchchat提供四个核心功能:
> python/pytorch llm执行:
- 自包含的模型部署:使用AOT电感器(提前电感器),Torchchat创建了独立于Python和Pytorch的独立的可执行文件(动态库)。这样可以确保在生产环境中稳定的模型运行时,而无需重新编译。 AOT电感器通过有效的二进制格式优化部署,超过了火炬的开销。
- >移动设备执行:利用executorch,Torchchat优化了移动设备和嵌入式设备的模型,生成了执行的PTE工件。
> - 模型评估:>使用框架评估LLM性能,对研究和基准测试至关重要。
- 为什么在本地运行llms?>
当地LLM执行提供了几个优点:
lm_eval
增强的隐私:
实时性能:
最大程度地减少需要快速响应的应用程序的延迟,例如Interactive聊天机器人和实时内容生成。- >
- 脱机功能:在有限或没有互联网连接的区域中启用LLM使用。
- 成本优化:比云API的成本效益更高 python的本地设置:逐步指南
- > >
- 克隆存储库:使用git克隆torchchat存储库:
>
-
>
>安装:git clone git@github.com:pytorch/torchchat.git
假设安装了Python 3.10,创建一个虚拟环境:> -
使用Torchchat:
-
>列表支持的模型:
python -m venv .venv source .venv/bin/activate
-
下载模型:
安装拥抱面CLI(),创建一个拥抱的脸部帐户,生成访问令牌,然后登录( )。下载模型(例如, ):pip install huggingface_hub
>huggingface-cli login
stories15M
./install_requirements.sh
> 运行模型: - 生成文本:
> 或使用聊天模式:
python torchchat.py --help
python torchchat.py list
>请求访问: 对于需要访问的模型(例如, - ),请按照错误消息中的说明进行操作。
llama3
高级用法:微调性能
-
git clone git@github.com:pytorch/torchchat.git
精确控制(
):- 调整速度/准确性权衡的数据类型(例如,
- )。
--dtype
just-In-time(JIT)汇编():--dtype fast
>提高推理速度(但增加了启动时间)。 - 量化():
--compile
使用JSON配置文件降低模型大小并提高速度。 - >设备规范():
--quantize
指定设备(例如,)。 -
结论
--device
> Torchchat简化了本地LLM执行,使高级AI更容易访问。本指南为探索其功能提供了基础。 强烈建议对Torchchat的特征进行进一步研究。
以上是Pytorch' torchchat教程:与Python的本地设置的详细内容。更多信息请关注PHP中文网其他相关文章!

由于AI的快速整合而加剧了工作场所的迅速危机危机,要求战略转变以外的增量调整。 WTI的调查结果强调了这一点:68%的员工在工作量上挣扎,导致BUR

约翰·塞尔(John Searle)的中国房间论点:对AI理解的挑战 Searle的思想实验直接质疑人工智能是否可以真正理解语言或具有真正意识。 想象一个人,对下巴一无所知

与西方同行相比,中国的科技巨头在AI开发方面的课程不同。 他们不专注于技术基准和API集成,而是优先考虑“屏幕感知” AI助手 - AI T

MCP:赋能AI系统访问外部工具 模型上下文协议(MCP)让AI应用能够通过标准化接口与外部工具和数据源交互。由Anthropic开发并得到主要AI提供商的支持,MCP允许语言模型和智能体发现可用工具并使用合适的参数调用它们。然而,实施MCP服务器存在一些挑战,包括环境冲突、安全漏洞以及跨平台行为不一致。 Forbes文章《Anthropic的模型上下文协议是AI智能体发展的一大步》作者:Janakiram MSVDocker通过容器化解决了这些问题。基于Docker Hub基础设施构建的Doc

有远见的企业家采用的六种策略,他们利用尖端技术和精明的商业敏锐度来创造高利润的可扩展公司,同时保持控制权。本指南是针对有抱负的企业家的,旨在建立一个

Google Photos的新型Ultra HDR工具:改变图像增强的游戏规则 Google Photos推出了一个功能强大的Ultra HDR转换工具,将标准照片转换为充满活力的高动态范围图像。这种增强功能受益于摄影师

技术架构解决了新兴的身份验证挑战 代理身份集线器解决了许多组织仅在开始AI代理实施后发现的问题,即传统身份验证方法不是为机器设计的

(注意:Google是我公司的咨询客户,Moor Insights&Strateging。) AI:从实验到企业基金会 Google Cloud Next 2025展示了AI从实验功能到企业技术的核心组成部分的演变,


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

禅工作室 13.0.1
功能强大的PHP集成开发环境

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

SublimeText3汉化版
中文版,非常好用

Atom编辑器mac版下载
最流行的的开源编辑器