向量流：生锈的记忆效率索引-人工智能-PHP中文网

首页

科技周边

人工智能

向量流：生锈的记忆效率索引

Lisa Kudrow

Apr 12, 2025 am 10:42 AM

介绍

正在引入嵌入中的矢量流，该功能旨在优化大规模文档嵌入。使用RUST的并发启用异步分解和嵌入可以减少记忆使用情况并加快过程的速度。今天，我将展示如何将其与编织矢量数据库集成在一起，以进行无缝的图像嵌入和搜索。

在我的上一篇文章中，用嵌入方式将嵌入式管道增压起来，我讨论了嵌入背后的想法，以及它如何使从多种模式中创建嵌入式。在本文中，我想介绍一个名为矢量流的嵌入的新功能，并查看它如何与Weaviate Vector数据库一起工作。

向量流：生锈的记忆效率索引

概述

嵌入式中的矢量流媒体通过异步分解与Rust的并发性优化了大规模文档的嵌入。
它通过并联处理块来解决传统嵌入方法中的记忆和效率问题。
与Weaviate集成可以使无缝的嵌入和搜索矢量数据库中。
实现向量流涉及创建数据库适配器，启动嵌入模型和嵌入数据。
这种方法为大规模文档嵌入提供了更高效，可扩展和灵活的解决方案。

问题是什么？

首先，检查创建嵌入的当前问题，尤其是在大规模文档中。当前的嵌入框架在两个步骤的过程中运行：切块和嵌入。首先，从所有文件中提取文本，并创建块/节点。然后，将这些块馈送到具有特定批量大小的嵌入模型中，以处理嵌入。在完成此操作的同时，块和嵌入式保留在系统内存上。

当文件和嵌入尺寸很小时，这不是问题。但是，当有很多文件时，这将成为一个问题，并且您正在使用大型模型，更糟糕的是多矢量嵌入。因此，要处理此操作，需要一个高RAM才能处理嵌入。另外，如果同步完成，则在创建块的同时浪费了很多时间，因为块并不是计算较重的操作。随着块的制作，将它们传递到嵌入模型将是有效的。

我们解决问题的解决方案

解决方案是创建一个异步分块和嵌入任务。我们可以使用Rust的并发模式和线程安全有效地产生螺纹来处理此任务。这是使用RUST的MPSC（多生产者单个消费者）模块完成的，该模块通过线程之间传递消息。因此，这会创建一块用缓冲区传递到嵌入线的块流。缓冲区完成后，它将块嵌入块并将嵌入式发送回主线程，然后将它们发送到矢量数据库。这样可以确保任何一次操作都不会浪费时间，也不会浪费瓶颈。此外，系统仅存储块和嵌入缓冲区中的块，一旦将它们移至矢量数据库，它们就会从内存中擦除它们。

向量流：生锈的记忆效率索引

示例用嵌入的用例

现在，让我们看看此功能中的功能：

使用嵌入，将向量从文件目录传输到矢量数据库是一个简单的三步过程。

为矢量数据库创建一个适配器：这是围绕数据库函数的包装器，它允许您创建索引，将元数据从embedanything的格式转换为数据库所需的格式，以及插入嵌入式的函数。突出数据库的适配器已经创建并在此处存在。

启动您选择的嵌入模型：您可以从不同的本地模型甚至云模型中进行选择。还可以通过设置块大小和缓冲区大小来确定配置，以一次将多少嵌入。理想情况下，这应该尽可能高，但是系统RAM会限制这一点。

从嵌入式呼叫嵌入功能：只需传递嵌入目录路径，嵌入模型，适配器和配置即可。

在此示例中，我们将嵌入图像目录并将其发送到向量数据库。

步骤1：创建适配器

在嵌入内容中，适配器是在外部创建的，以免使图书馆沉重，并且可以选择要使用的数据库。这是一个简单的编织适配器：

从embed_anything Import embeddata

从embed_anything.vectordb导入适配器

weaviateadapter类（适配器）：

def __init __（self，api_key，url）：

super（）.__ init __（api_key）

self.client = weaviate.connect_to_weaviate_cloud（

cluster_url = url，auth_credentials = wvc.init.auth.api_key（api_key）

）

如果self.client.is_ready（）：

打印（“编织已准备就绪”）

def create_index（self，index_name：str）：

self.index_name = index_name

self.collection = self.client.collections.create（

index_name，vectorizer_config = wvc.config.configure.vectorizer.none（）

）

返回self.Collection

def convert（self，嵌入：列表[embeddata]）：

数据= []

用于嵌入嵌入：

属性=嵌入。metadata

属性[“ text”] = embedding.text

data.append（

wvc.data.dataobject（properties =属性，vector = embedding.embedding）

）

返回数据

def upsert（自我，嵌入）：

data = self.convert（嵌入）

self.client.collections.get（self.index_name）.data.insert_many（data）

def delete_index（self，index_name：str）：

self.client.collections.delete（index_name）

###启动客户端和索引

url =“ your-weaviate-url”

api_key =“您的weaviate-api-key”

weaviate_adapter = weaviateadapter（api_key，url）

index_name =“ test_index”

如果weaviate_adapter.client.collections.list_all（）中的index_name（）：

weaviate_adapter.delete_index（index_name）

weaviate_adapter.create_index（“ test_index”）

步骤2：创建嵌入模型

在这里，由于我们正在嵌入图像，因此我们可以使用剪辑模型

导入embed_anything inocting wht ymodel

型号= embed_anything.embeddingmodel.from_pretretained_cloud（

embed_anything.thichmodel.clip，

模型_）

步骤3：嵌入目录

data = embed_anything.embed_image_directory（

“ \ image_directory”，

嵌入式=模型，

适配器= weaviate_adapter，

config = embed_anything.imageembedconfig（buffer_size = 100），

）

步骤4：查询矢量数据库

query_vector = embed_anything.embed_query（[“猫的图像”]，embeder =型号）[0] .embedding

步骤5：查询矢量数据库

响应= weaviate_adapter.collection.query.near_vector（

近_vector = query_vector，

限制= 2，

return_metadata = wvc.query.metadataquery（eslenty = true），

）

检查响应；