首页 >web前端 >js教程 >在 docker 容器中设置 PostgreSQL w/ pgvector

在 docker 容器中设置 PostgreSQL w/ pgvector

Susan Sarandon
Susan Sarandon原创
2024-12-02 17:07:12812浏览

Setup PostgreSQL w/ pgvector in a docker container

这篇文章是我上一篇关于如何在 docker 中设置本地 MySQL 实例的文章的后续。

RAG(检索增强生成)正在迅速成为人工智能应用程序的“Hello World”。如果您正在使用大型语言模型,那么毫无疑问您在某个时候需要创建 RAG 管道。 RAG 的一个重要组成部分是向量数据库,一个流行的选项是 pgvector - Postgres 的开源向量相似性搜索。 以下是如何在 Docker 容器中快速设置本地实例。

拉取并运行镜像

从 docker 存储库中提取最新的镜像。将 17 替换为您选择的 Postgres 服务器版本。

docker pull pgvector/pgvector:pg17

运行镜像,设置root用户密码,并公开默认的Postgres端口。

docker run -d --name <container_name> -e POSTGRES_PASSWORD=postgres -p 5432:5432 pgvector/pgvector:pg17

在容器内创建一个数据库

在 Postgres 服务器运行的情况下,在容器内创建一个数据库。

docker exec -it <container_name> createdb -U postgres <database_name>

连接到数据库

现在我们可以从应用程序连接到数据库并初始化 pgvector 扩展。我将使用 JavaScript。设置整个应用程序超出了本文的范围,但您需要安装几个依赖项:

pnpm add pg pgvector

在您的环境中设置 DATABASE_URL。我使用 .env 文件。它应该遵循以下格式:

DATABASE_URL=postgresql://<pg_user>:<pg_password>@localhost:5432/<database_name>

对于本地开发,请使用@localhost,但如果您使用的是 docker-compose.yml 之类的内容并已命名服务,则应使用服务的名称,例如@db。

在您的应用程序代码中,创建连接:

const pool = new pg.Pool({
  connectionString: process.env.DATABASE_URL,
});

然后,初始化pgvector并创建一个新表:

async function createStore() {
  // Initialize pgvector extension and create table if not exists
  await pool.query('CREATE EXTENSION IF NOT EXISTS vector');

  return {
    vectorStore: await PGVectorStore.initialize(embeddings, {
      postgresConnectionOptions: {
        connectionString: process.env.DATABASE_URL,
      },
      tableName: 'documents', // Default table name
    }),
  };
}

通过 vectorStore 设置,您可以使用 vectorStore.addDocuments 向其中添加内容,并使用 vectorStore.similaritySearch 查询上下文。

这篇文章就是这样。也许下次我会探索 pgvector 的更具体用途,和/或将它与 Drizzle ORM 一起使用! ?

以上是在 docker 容器中设置 PostgreSQL w/ pgvector的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn