利用“设备” AI的力量:建立个人聊天机器人CLI
在最近的过去,个人AI助手的概念似乎是科幻小说。想象一下,科技爱好者亚历克斯(Alex)梦想着一个聪明的本地AI伴侣 - 不依赖云服务或外部服务器。多亏了小语言模型(SLM)的进步,Alex的梦想现在是现实。本文指导您使用Alex使用Huggingface的Smollm,Langchain的灵活性和Typer的用户友好界面来创建AI CHAT CLI应用程序的旅程。您将建立一个功能性的AI助手,能够在终端中聊天,回答问题和节省对话。让我们来探索设备AI的世界!
关键学习目标:
- 掌握拥抱面Smollm型号的功能和应用。
- 利用SLM型号用于设备AI应用程序。
- 在SLM体系结构中探索分组的疑问注意力(GQA)。
- 使用TYPER和富图书馆开发交互式CLI应用程序。
- 将拥抱面模型与Langchain集成,以进行健壮的AI应用。
目录:
- 引入HuggingFace Smollm
- 了解分组的疑问(GQA)
- 深入研究GQA
- 利用Smollm
- 探索泰珀
- 实施Typer
- 项目设置
- 构建聊天应用程序
- 常见问题
拥抱面Smollm:近距离看
Smollm是一系列尖端的小语言模型,有三种尺寸(135m,360m和1.7b参数)。这些模型接受了高质量的语料库(Cosmopedia V2,综合教科书,教育Python样本和教育网络数据)的培训,这些模型以与常识性推理和世界知识相关的基准表现出色,根据拥抱面的大小类别中的其他模型优于其他模型。
性能比较:
主题分布:
135m和360m的参数模型利用类似Mobillm的架构,结合了GQA并优先考虑深度超过宽度。
分组疑问(GQA):效率重新定义
注意机制有多种形式:
- 多头注意力(MHA):每个头部都有独立的查询,钥匙和价值头 - 计算昂贵。
- 多传奇注意(MQA):分享钥匙和价值头,但每个头保持着自己的查询 - 比MHA更有效。
- 分组质量注意(GQA):小组注意力头,分组中的钥匙和价值头部共享 - 优化速度和效率。将其视为一个合作的团队,共享资源以提高生产率。
详细了解GQA
GQA通过对注意力头进行分组,在每个组中共享密钥和价值头来提高处理效率。这与传统方法形成鲜明对比,每个方法都有自己的钥匙和值。
主要注意事项:
- GQA-G:与G组的GQA。
- GQS-1:类似于MQA的单组情况。
- GQA-H:组的数量等于注意力头的数量,类似于MHA。
GQA的好处:
- 提高速度:加工更快,尤其是在大型模型中。
- 提高效率:减少数据处理,节省内存和处理能力。
- 最佳平衡:在速度和准确性之间取得平衡。
与Smollm一起工作
使用PIP安装Pytorch和变压器:
PIP安装火炬变压器
以下代码段(将放置在main.py
中)使用SMOLLM-360M教学模型(您可以适应其他尺寸):
从变形金刚导入AutomodelForCausAllm,AutoTokenizer checkpoint =“ huggingfacetb/smollm-360m构造” #...(与原始文章一样的其余代码)
示例输出:
(继续使用其余部分 - 型,项目设置,实现聊天应用程序以及FAQ - 遵循原始文章的结构和内容,调整措辞和句子结构,以改善流量和清晰度,同时保持原始含义。)
以上是如何使用Huggingface Smollm建立个人AI助手的详细内容。更多信息请关注PHP中文网其他相关文章!

https://undressaitool.ai/是功能强大的移动应用程序,具有成人内容的高级AI功能。立即创建AI生成的色情图像或视频!

有关使用distressai创建色情图片/视频的教程:1。打开相应的工具Web链接; 2。单击工具按钮; 3。根据页面提示上传所需的生产内容; 4。保存并享受结果。

脱衣服AI的官方地址是:https://undressaitool.ai/; undressai是功能强大的移动应用程序,具有成人内容的高级AI功能。立即创建AI生成的色情图像或视频!

有关使用distressai创建色情图片/视频的教程:1。打开相应的工具Web链接; 2。单击工具按钮; 3。根据页面提示上传所需的生产内容; 4。保存并享受结果。

脱衣服AI的官方地址是:https://undressaitool.ai/; undressai是功能强大的移动应用程序,具有成人内容的高级AI功能。立即创建AI生成的色情图像或视频!

有关使用distressai创建色情图片/视频的教程:1。打开相应的工具Web链接; 2。单击工具按钮; 3。根据页面提示上传所需的生产内容; 4。保存并享受结果。
![[带AI的吉卜力风格图像]介绍如何使用Chatgpt和版权创建免费图像](https://img.php.cn/upload/article/001/242/473/174707263295098.jpg?x-oss-process=image/resize,p_40)
OpenAI发布的最新模型GPT-4o,不仅能生成文本,还具备图像生成功能,引发广泛关注。其中最受瞩目的功能便是“吉卜力风格插画”的生成。只需将照片上传至ChatGPT,并给出简单的指令,即可生成宛如吉卜力工作室作品般梦幻的图像。本文将详细解读实际操作流程、效果感受,以及需要注意的错误和版权问题。 OpenAI发布的最新模型“o3”详情请点击此处⬇️ OpenAI o3(ChatGPT o3)详解:特性、定价体系及o4-mini介绍 吉卜力风格文章的英文版请点击此处⬇️ 利用ChatGPT创作吉

作为一种新的交流方法,在地方政府中使用和引入Chatgpt引起了人们的关注。尽管这种趋势在广泛的领域正在发展,但一些地方政府拒绝使用Chatgpt。 在本文中,我们将介绍地方政府中ChatGPT实施的示例。我们将通过各种改革实例,包括支持文件创建和与公民对话,从而探索如何通过各种改革实例来实现地方政府服务的质量和效率提高。 不仅旨在减少员工工作量并改善公民的便利性的地方政府官员,而且都对高级用例感兴趣。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver CS6
视觉化网页开发工具