这个分为两部分的系列使用SQLite进行机器学习探索。 上一篇文章讨论了SQLite在生产就绪的Web应用程序中的越来越多的作用。本文着重于使用sqlite实施检索功能。
>>用于使用生成AI的自定义Web应用程序,请访问losangelesaiapps.com >
代码可用>在此处。。
传统的抹布实施通常涉及:
- >在抹布上搜索教程。
- 选择一个流行的框架(Langchain,LlamainDex)。
- 选择一个云向量数据库(Pinecone,Weaviate)。 >
- 集成这些组件。
- 有效,这种方法可能过于复杂,尤其是对于初学者而言。 本文使用SQLITE和
>
sqlite-vec
这种方法消除了对云矢量数据库和笨重框架的需求。
Sqlite的强度在于其可扩展性。 与Python库类似的扩展名添加了C中写入的功能。一个很好的示例是全文搜索(FTS)扩展。 添加矢量搜索功能,从而使语义理解超出关键字匹配。 寻找“马”可能会返回“马术”或“小马”。
使用虚拟表,提供:sqlite-vec
>sqlite-vec
>自定义数据源:
- 灵活功能:支持专业的索引和复杂的数据类型。
- >无缝集成:与标准sqlite查询语法集成。
- 后端逻辑是在单独的模块中实现的。 使用: >创建虚拟表
- >指定模块(在此,
CREATE VIRTUAL TABLE my_table USING my_extension_module();代码演练
my_extension_module()
vec0
代码(sqlite-vec
repo link
文件作为示例数据(主要是物理相关)。 是sqlite数据库文件。
,- ,
- )。创建一个虚拟环境并运行
requirements.txt
sqlite-vec
>openai
openai api键:python-dotenv
获取openai api键。pip install -r requirements.txt
-
> 加载扩展名:python代码加载
sqlite-vec
>扩展名并创建一个虚拟表:
CREATE VIRTUAL TABLE my_table USING my_extension_module();
documents
表存储嵌入式(embedding
),fileNames(file_name
)和content(content
)。
表示辅助字段。
- >>嵌入和插入:
.txt
代码通过 文件迭代,使用OpenAI API生成嵌入式,然后将它们插入数据库:
db.enable_load_extension(True) sqlite_vec.load(db) db.enable_load_extension(False) db.execute(''' CREATE VIRTUAL TABLE documents USING vec0( embedding float[1536], +file_name TEXT, +content TEXT ) ''')
- rag查询:
# ... (OpenAI embedding function) ... for file_name in os.listdir("data"): # ... (Open file, get content, get embedding) ... db.execute( 'INSERT INTO documents (embedding, file_name, content) VALUES (?, ?, ?)', (serialize_float32(embedding), file_name, content) ) db.commit()然后将结果用作openai聊天完成的上下文来回答查询。
>
结论
>大大简化了抹布。 它消除了对复杂框架和云服务的需求,使其具有成本效益且易于迭代。 虽然缩放可能最终需要一个更健壮的数据库,但sqlite-vec
>为较小的项目提供了引人注目的解决方案。 扩展名支持多种编程语言。sqlite-vec
以上是在Sqlite中检索增强发电的详细内容。更多信息请关注PHP中文网其他相关文章!

随着AI应用的爆炸式增长,企业正从传统的搜索引擎优化(SEO)转向生成式引擎优化(GEO)。 谷歌正引领这一转变。其“AI概述”功能已服务于超过十亿用户,在用户点击链接之前提供完整的答案。[^2] 其他参与者也在迅速崛起。ChatGPT、微软Copilot和Perplexity正在创造一种全新的“答案引擎”类别,完全绕过了传统的搜索结果。 如果您的企业没有出现在这些AI生成的答案中,潜在客户可能永远不会发现您——即使您在传统的搜索结果中排名靠前。 从SEO到GEO——这究竟意味着什么? 几十年来

让我们探索人工通用智能(AGI)的潜在途径。 该分析是我正在进行的《福布斯》列的AI进步的一部分,并深入研究了实现AGI和人工超智慧(ASI)的复杂性。 (请参阅相关艺术

人机互动:一场互适应的微妙舞蹈 与AI聊天机器人互动,如同参与一场微妙的相互影响的舞蹈。你的提问、回应和偏好逐渐塑造着系统,使其更好地满足你的需求。现代语言模型通过显式反馈机制和隐式模式识别来适应用户的偏好。它们学习你的沟通风格,记住你的偏好,并逐渐调整其回应以符合你的预期。 然而,在我们训练数字伙伴的同时,同样重要的事情也在反向发生。我们与这些系统的互动正在微妙地重塑我们自身的沟通模式、思维过程,甚至对人际对话的期望。 我们与AI系统的互动已经开始重塑我们对人际互动的期望。我们适应了即时回应、

AI简化了野火恢复允许 澳大利亚科技公司Archistar的AI软件利用机器学习和计算机视觉,可以自动评估建筑计划,以遵守当地法规。这种验证前具有重要意义

爱沙尼亚的数字政府:美国的典范? 美国在官僚主义的效率低下方面挣扎,但爱沙尼亚提供了令人信服的选择。 这个小国拥有由AI支持的近100%数字化的,以公民为中心的政府。 这不是

计划婚礼是一项艰巨的任务,即使是最有条理的夫妇,也常常压倒了婚礼。 本文是关于AI影响的持续福布斯系列的一部分(请参阅此处的链接),探讨了生成AI如何彻底改变婚礼计划。 婚礼上

企业越来越多地利用AI代理商进行销售,而政府则将其用于各种既定任务。 但是,消费者倡导强调个人需要拥有自己的AI代理人作为对经常定位的辩护的必要性

Google正在领导这一转变。它的“ AI概述”功能已经为10亿用户提供服务,在任何人单击链接之前提供完整的答案。[^2] 其他球员也正在迅速获得地面。 Chatgpt,Microsoft Copilot和PE


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Dreamweaver Mac版
视觉化网页开发工具

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。