Classement de recherche en texte intégral PostgreSQL par position-js tutoriel-php.cn

Maison

interface Web

js tutoriel

Classement de recherche en texte intégral PostgreSQL par position

Patricia Arquette

Dec 13, 2024 pm 01:08 PM

PostgreSQL Full Text Search Rank by Position

Récemment, j'ai rencontré un problème avec la recherche en texte intégral. J'utilise cette fonctionnalité dans ma saisie de recherche, où le backend envoie des indices de correspondances possibles au fur et à mesure que vous tapez. La base de données principale est PostgreSQL. J'avais besoin que les indices soient classés selon la position du terme recherché dans le texte.

Donc, si vous recherchez le titre "Star Wars", vous obtiendrez le message "Star Wars" en premier au lieu de "Comment Star Wars 7-9 a changé le monde de Star Wars (un documentaire amusant sur Star Wars)" qui peut avoir classement plus élevé puisque le terme est présent 3 fois.

Recherche en texte intégral dans PostgreSQL

La recherche en texte intégral dans PostgreSQL peut être réalisée assez facilement. Il existe deux outils principaux à utiliser :

tsvector - représente un document consultable.
tsquery - représente la requête de recherche à effectuer sur un document.

Disons que nous souhaitons rechercher les titres de nos articles de blog. Pour les rendre consultables, nous pouvons utiliser la requête suivante :

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);

Dans ce cas, nous convertissons dynamiquement les titres des articles en tsvecteur à chaque recherche. Cependant, cette transformation prend du temps. Une meilleure approche consiste à effectuer cette transformation à l'avance dans la base de données et à la stocker également sous forme d'index pour les titres pour une recherche plus rapide.

Créons une nouvelle colonne de vecteurs de titres et indexons également cette nouvelle colonne :

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);

Essayez maintenant de rechercher le terme "JavaScript"

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;

Vous pouvez également créer des index à partir des vecteurs ts directement sur la colonne des titres comme ceci :

CREATE INDEX titles_fts_idx ON blogposts USING GIN (to_tsvector(posts.title));

et utilisez la recherche comme ceci :

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ posts.title;

Désormais, la recherche en texte intégral sera incroyablement rapide, s'effectuant en quelques millisecondes.

Classement des résultats

PostgreSQL fournit la fonctionnalité ts_rank, qui vous permet d'évaluer les résultats de recherche et de les classer en fonction de leur classement. PostgreSQL prend en charge les options de classement suivantes :

0 (valeur par défaut) ignore la longueur du document
1 divise le rang par 1 le logarithme de la longueur du document
2 divise le rang par la longueur du document
4 divise le rang par la distance harmonique moyenne entre les étendues (ceci n'est implémenté que par ts_rank_cd)
8 divise le rang par le nombre de mots uniques dans le document
16 divise le rang par 1 le logarithme du nombre de mots uniques dans le document
32 divise le rang à lui seul 1

Vous pouvez utiliser le ts_rank comme ceci :

SELECT
    ...
ts_rank(search_vector, to_tsquery('JavaScript'), 0) as rank_title
    ...
ORDER BY rank_title DESC NULLS LAST

Cependant, il n'existe pas d'option de classement intégrée basée sur la position du terme de recherche dans la chaîne (c'est-à-dire la colonne de titre).

POSITION à la rescousse

Heureusement, il existe la fonction POSITION dans PostgreSQL. La fonction PostgreSQL POSITION est utilisée pour trouver l'emplacement d'une sous-chaîne dans une chaîne donnée. Dans notre cas nous pouvons l'utiliser comme ça

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);

ts_rank utilise l'entier de normalisation 2 car 2 divise le classement par la longueur du document
Le nombre magique 0,0001 consiste à éviter de diviser par 0 car la fonction POSTION compte à partir de 1 et non de 0 et renvoie 0 si la chaîne n'est pas trouvée.

Le code final peut ressembler à ceci :

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);

Rechercher plus de termes

Une mise en garde doit être mentionnée si vous recherchez plusieurs termes à la fois (comme JavaScript et TypeScript).

Les arguments de la fonction to_tsquery peuvent être utilisés avec une grande flexibilité, y compris les opérateurs logiques, etc. La fonction POSITION, par contre, est "juste" une sous-chaîne dans une chaîne.

Exemple du monde réel

Voici mon exemple d'un point de terminaison du monde réel dans l'application Web SvelteKit qui utilise la bibliothèque npm postgres (sql) :

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;

Voici les liens vers la documentatio en la matière :

https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-QUERIES https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-DOCUMENTS
https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-RANKING
https://www.postgresql.org/docs/9.1/functions-string.html

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Java vs Javascript: une comparaison détaillée pour les développeursMay 16, 2025 am 12:01 AM

JavaandjavascriptAredistinctLanguages: JavaisUsedFormenterpriseAndMobileApps, tandis que javascriptisforinteractivewebpages.1) javais compilé, statistiquement type, Andrunsonjvm.2)

Types de données JavaScript: Y a-t-il une différence entre le navigateur et les nodejs?May 14, 2025 am 12:15 AM

Les types de données de base JavaScript sont cohérents dans les navigateurs et Node.js, mais sont gérés différemment des types supplémentaires. 1) L'objet global est la fenêtre du navigateur et global dans Node.js. 2) Objet tampon unique de Node.js, utilisé pour traiter les données binaires. 3) Il existe également des différences dans les performances et le traitement du temps, et le code doit être ajusté en fonction de l'environnement.

Commentaires JavaScript: un guide pour utiliser // et / * * /May 13, 2025 pm 03:49 PM

JavascriptUsestwotypesofComments: unique (//) et multi-ligne (//). 1) use // forquicknotesorsings-lineexplanations.2) use // forlongErexPlanationsorcommentingoutblocksofcode.commentsShouldExplatethe'why ', notthewat', et bplacedabovovereLantCodeForCaReric

Python vs JavaScript: une analyse comparative pour les développeursMay 09, 2025 am 12:22 AM

La principale différence entre Python et JavaScript est le système de type et les scénarios d'application. 1. Python utilise des types dynamiques, adaptés à l'informatique scientifique et à l'analyse des données. 2. JavaScript adopte des types faibles et est largement utilisé pour le développement frontal et complet. Les deux ont leurs propres avantages dans la programmation asynchrone et l'optimisation des performances, et doivent être décidées en fonction des exigences du projet lors du choix.

Python vs JavaScript: Choisir le bon outil pour le travailMay 08, 2025 am 12:10 AM

Que ce soit pour choisir Python ou JavaScript dépend du type de projet: 1) Choisissez Python pour les tâches de science et d'automatisation des données; 2) Choisissez JavaScript pour le développement frontal et complet. Python est favorisé pour sa bibliothèque puissante dans le traitement et l'automatisation des données, tandis que JavaScript est indispensable pour ses avantages dans l'interaction Web et le développement complet.

Python et Javascript: comprendre les forces de chacunMay 06, 2025 am 12:15 AM

Python et JavaScript ont chacun leurs propres avantages, et le choix dépend des besoins du projet et des préférences personnelles. 1. Python est facile à apprendre, avec une syntaxe concise, adaptée à la science des données et au développement back-end, mais a une vitesse d'exécution lente. 2. JavaScript est partout dans le développement frontal et possède de fortes capacités de programmation asynchrones. Node.js le rend adapté au développement complet, mais la syntaxe peut être complexe et sujet aux erreurs.

Core de JavaScript: est-il construit sur C ou C?May 05, 2025 am 12:07 AM

Javascriptisnotbuiltoncorc; il est en interprétéLanguageThatrunSoninesoftenwritteninc .1) javascriptwasdesignedasalightweight, interprété de LanguageForwebbrowsers.2) EnginesevolvedFromSimpleInterpreterstoJitCompilers, typicalinc, impropringperformance.

Applications JavaScript: de front-end à back-endMay 04, 2025 am 12:12 AM

JavaScript peut être utilisé pour le développement frontal et back-end. L'endouage frontal améliore l'expérience utilisateur via les opérations DOM, et le back-end gère les tâches du serveur via Node.js. 1. Exemple frontal: modifiez le contenu du texte de la page Web. 2. Exemple backend: Créez un serveur Node.js.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

<🎜>: Grow A Garden - Guide de mutation complet

4 Il y a quelques semainesByDDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Nordhold: Système de fusion, expliqué

1 Il y a quelques moisBy尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

<🎜> Obscur: Expedition 33 - Comment obtenir des catalyseurs de chrome parfaits

2 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Navigateur d'examen sécurisé

Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.