这篇文章是我上一篇关于如何在 docker 中设置本地 MySQL 实例的文章的后续。
RAG(检索增强生成)正在迅速成为人工智能应用程序的“Hello World”。如果您正在使用大型语言模型,那么毫无疑问您在某个时候需要创建 RAG 管道。 RAG 的一个重要组成部分是向量数据库,一个流行的选项是 pgvector - Postgres 的开源向量相似性搜索。 以下是如何在 Docker 容器中快速设置本地实例。
从 docker 存储库中提取最新的镜像。将 17 替换为您选择的 Postgres 服务器版本。
docker pull pgvector/pgvector:pg17
运行镜像,设置root用户密码,并公开默认的Postgres端口。
docker run -d --name <container_name> -e POSTGRES_PASSWORD=postgres -p 5432:5432 pgvector/pgvector:pg17
在 Postgres 服务器运行的情况下,在容器内创建一个数据库。
docker exec -it <container_name> createdb -U postgres <database_name>
现在我们可以从应用程序连接到数据库并初始化 pgvector 扩展。我将使用 JavaScript。设置整个应用程序超出了本文的范围,但您需要安装几个依赖项:
pnpm add pg pgvector
在您的环境中设置 DATABASE_URL。我使用 .env 文件。它应该遵循以下格式:
DATABASE_URL=postgresql://<pg_user>:<pg_password>@localhost:5432/<database_name>
对于本地开发,请使用@localhost,但如果您使用的是 docker-compose.yml 之类的内容并已命名服务,则应使用服务的名称,例如@db。
在您的应用程序代码中,创建连接:
const pool = new pg.Pool({ connectionString: process.env.DATABASE_URL, });
然后,初始化pgvector并创建一个新表:
async function createStore() { // Initialize pgvector extension and create table if not exists await pool.query('CREATE EXTENSION IF NOT EXISTS vector'); return { vectorStore: await PGVectorStore.initialize(embeddings, { postgresConnectionOptions: { connectionString: process.env.DATABASE_URL, }, tableName: 'documents', // Default table name }), }; }
通过 vectorStore 设置,您可以使用 vectorStore.addDocuments 向其中添加内容,并使用 vectorStore.similaritySearch 查询上下文。
这篇文章就是这样。也许下次我会探索 pgvector 的更具体用途,和/或将它与 Drizzle ORM 一起使用! ?
以上是在 docker 容器中设置 PostgreSQL w/ pgvector的详细内容。更多信息请关注PHP中文网其他相关文章!