搜索
首页web前端js教程PostgreSQL 全文搜索按位置排名

PostgreSQL Full Text Search Rank by Position

最近,我遇到了全文搜索的问题。我在搜索输入中使用此功能,后端会在您键入时发送可能匹配的提示。后端数据库是PostgreSQL。我需要根据搜索词在文本中的位置对提示进行排名。

因此,如果您搜索“星球大战”标题,您将首先看到“星球大战”帖子,而不是“星球大战 7-9 如何改变星球大战世界(一部关于星球大战的有趣制作的纪录片)”,这可能会该词出现 3 次后排名更高。

PostgreSQL 中的全文搜索

PostgreSQL 中的全文搜索可以很容易地实现。主要使用两个工具:

  • tsvector - 表示可搜索文档。
  • tsquery - 表示针对文档执行的搜索查询。

假设我们要搜索博客文章的标题。为了使它们可搜索,我们可以使用以下查询:

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);

在这种情况下,我们会在每次搜索时动态地将帖子标题转换为 tsvector。然而,这种转变需要一些时间。更好的方法是提前在数据库中执行此转换,并将其存储为标题的索引,以便更快地搜索。

让我们创建一个新的标题向量列,并为这个新列建立索引:

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);

现在尝试搜索术语“JavaScript”

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;

您还可以直接在标题列上从 ts 向量创建索引,如下所示:

CREATE INDEX titles_fts_idx ON blogposts USING GIN (to_tsvector(posts.title));

并使用这样的搜索:

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ posts.title;

现在,全文搜索将非常快,只需几毫秒即可完成。

对结果进行排名

PostgreSQL 提供了 ts_rank 功能,它允许您对搜索结果进行评分并根据排名对其进行排序。 PostgreSQL 支持以下排名选项:

  • 0(默认值)忽略文档长度
  • 1 将排名除以 1 文档长度的对数
  • 2 将排名除以文档长度
  • 4 将排名除以范围之间的平均调和距离(这仅由 ts_rank_cd 实现)
  • 8 将排名除以文档中唯一单词的数量
  • 16 将排名除以 1,即文档中唯一单词数量的对数
  • 32 将排名除以 1

您可以像这样使用 ts_rank:

SELECT
    ...
ts_rank(search_vector, to_tsquery('JavaScript'), 0) as rank_title
    ...
ORDER BY rank_title DESC NULLS LAST

但是,没有基于搜索词在字符串中的位置(即标题列)的内置排名选项。

救援位置

幸运的是 PostgreSQL 中有 POSITION 函数。 PostgreSQL POSITION 函数用于查找给定字符串中子字符串的位置。在我们的例子中,我们可以像这样使用它

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);

ts_rank 使用归一化整数 2,因为 2 将排名除以文档长度
神奇数字 0.0001 是为了避免除以 0,因为 POSTION 函数从 1 开始计数,而不是从 0 开始计数,如果未找到字符串,则返回 0。

最终代码可能如下所示:

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);

搜索更多术语

如果您一次搜索多个术语(例如 JavaScriptTypeScript),则必须提及一个警告。

to_tsquery 函数的参数可以非常灵活地使用,包括逻辑运算符等。另一方面,POSITION 函数“只是”字符串中的一个子字符串。

现实世界的例子

这是我在 SvelteKit Web 应用程序中来自现实世界端点的示例,该应用程序使用 postgres (sql) npm 库:

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;

以下是相关文档的链接:

  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-QUERIES https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-DOCUMENTS
  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-RANKING
  • https://www.postgresql.org/docs/9.1/functions-string.html

以上是PostgreSQL 全文搜索按位置排名的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
JavaScript数据类型:浏览器和nodejs之间是否有区别?JavaScript数据类型:浏览器和nodejs之间是否有区别?May 14, 2025 am 12:15 AM

JavaScript核心数据类型在浏览器和Node.js中一致,但处理方式和额外类型有所不同。1)全局对象在浏览器中为window,在Node.js中为global。2)Node.js独有Buffer对象,用于处理二进制数据。3)性能和时间处理在两者间也有差异,需根据环境调整代码。

JavaScript评论:使用//和 / * * / * / * /JavaScript评论:使用//和 / * * / * / * /May 13, 2025 pm 03:49 PM

JavaScriptusestwotypesofcomments:single-line(//)andmulti-line(//).1)Use//forquicknotesorsingle-lineexplanations.2)Use//forlongerexplanationsorcommentingoutblocksofcode.Commentsshouldexplainthe'why',notthe'what',andbeplacedabovetherelevantcodeforclari

Python vs. JavaScript:开发人员的比较分析Python vs. JavaScript:开发人员的比较分析May 09, 2025 am 12:22 AM

Python和JavaScript的主要区别在于类型系统和应用场景。1.Python使用动态类型,适合科学计算和数据分析。2.JavaScript采用弱类型,广泛用于前端和全栈开发。两者在异步编程和性能优化上各有优势,选择时应根据项目需求决定。

Python vs. JavaScript:选择合适的工具Python vs. JavaScript:选择合适的工具May 08, 2025 am 12:10 AM

选择Python还是JavaScript取决于项目类型:1)数据科学和自动化任务选择Python;2)前端和全栈开发选择JavaScript。Python因其在数据处理和自动化方面的强大库而备受青睐,而JavaScript则因其在网页交互和全栈开发中的优势而不可或缺。

Python和JavaScript:了解每个的优势Python和JavaScript:了解每个的优势May 06, 2025 am 12:15 AM

Python和JavaScript各有优势,选择取决于项目需求和个人偏好。1.Python易学,语法简洁,适用于数据科学和后端开发,但执行速度较慢。2.JavaScript在前端开发中无处不在,异步编程能力强,Node.js使其适用于全栈开发,但语法可能复杂且易出错。

JavaScript的核心:它是在C还是C上构建的?JavaScript的核心:它是在C还是C上构建的?May 05, 2025 am 12:07 AM

javascriptisnotbuiltoncorc; saninterpretedlanguagethatrunsonenginesoftenwritteninc.1)javascriptwasdesignedAsalightweight,解释edganguageforwebbrowsers.2)Enginesevolvedfromsimpleterterterpretpreterterterpretertestojitcompilerers,典型地提示。

JavaScript应用程序:从前端到后端JavaScript应用程序:从前端到后端May 04, 2025 am 12:12 AM

JavaScript可用于前端和后端开发。前端通过DOM操作增强用户体验,后端通过Node.js处理服务器任务。1.前端示例:改变网页文本内容。2.后端示例:创建Node.js服务器。

Python vs. JavaScript:您应该学到哪种语言?Python vs. JavaScript:您应该学到哪种语言?May 03, 2025 am 12:10 AM

选择Python还是JavaScript应基于职业发展、学习曲线和生态系统:1)职业发展:Python适合数据科学和后端开发,JavaScript适合前端和全栈开发。2)学习曲线:Python语法简洁,适合初学者;JavaScript语法灵活。3)生态系统:Python有丰富的科学计算库,JavaScript有强大的前端框架。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具