cari
Rumahhujung hadapan webtutorial jsKedudukan Carian Teks Penuh PostgreSQL mengikut Kedudukan

PostgreSQL Full Text Search Rank by Position

Baru-baru ini, saya menghadapi masalah dengan carian teks penuh. Saya menggunakan ciri ini dalam input carian saya, di mana bahagian belakang menghantar petunjuk kemungkinan padanan semasa anda menaip. Pangkalan data bahagian belakang ialah PostgreSQL. Saya memerlukan pembayang untuk disenaraikan mengikut kedudukan istilah yang dicari dalam teks.

Jadi, jika anda mencari tajuk "Star Wars", anda akan mendapat siaran "Star Wars" terlebih dahulu dan bukannya "Bagaimana Star Wars 7- 9 mengubah dunia Star Wars (dokumentari yang menyeronokkan tentang Star Wars)" yang mungkin mempunyai kedudukan yang lebih tinggi kerana istilah itu ada 3 kali ganda.

Carian Teks Penuh dalam PostgreSQL

Carian teks penuh dalam PostgreSQL boleh dicapai dengan mudah. Terdapat dua alatan utama untuk digunakan:

  • tsvector - mewakili dokumen yang boleh dicari.
  • tsquery - mewakili pertanyaan carian untuk dilakukan terhadap dokumen.

Katakan kita mahu mencari tajuk catatan blog kita. Untuk menjadikannya boleh dicari, kita boleh menggunakan pertanyaan berikut:

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);

Dalam kes ini, kami menukar tajuk siaran kepada tsvector secara dinamik dengan setiap carian. Walau bagaimanapun, transformasi ini mengambil sedikit masa. Pendekatan yang lebih baik ialah melakukan transformasi ini terlebih dahulu dalam pangkalan data dan juga menyimpannya sebagai indeks untuk tajuk untuk carian yang lebih pantas.

Mari buat lajur baharu bagi vektor tajuk dan juga indeks lajur baharu ini:

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);

Sekarang cuba cari istilah "JavaScript"

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;

Anda juga boleh membuat indeks daripada vektor ts terus pada lajur tajuk seperti ini:

CREATE INDEX titles_fts_idx ON blogposts USING GIN (to_tsvector(posts.title));

dan gunakan carian seperti ini:

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ posts.title;

Kini, carian teks penuh akan menjadi sangat pantas, selesai dalam milisaat.

Kedudukan Keputusan

PostgreSQL menyediakan ciri ts_rank, yang membolehkan anda menjaringkan hasil carian dan menyusunnya berdasarkan kedudukan mereka. PostgreSQL menyokong pilihan kedudukan berikut:

  • 0 (lalai) mengabaikan panjang dokumen
  • 1 membahagikan pangkat dengan 1 logaritma panjang dokumen
  • 2 membahagikan pangkat dengan panjang dokumen
  • 4 membahagikan pangkat dengan jarak harmonik min antara takat (ini hanya dilaksanakan oleh ts_rank_cd)
  • 8 membahagikan pangkat dengan bilangan perkataan unik dalam dokumen
  • 16 membahagikan pangkat dengan 1 logaritma bilangan perkataan unik dalam dokumen
  • 32 membahagikan pangkat dengan sendirinya 1

Anda boleh menggunakan ts_rank seperti ini:

SELECT
    ...
ts_rank(search_vector, to_tsquery('JavaScript'), 0) as rank_title
    ...
ORDER BY rank_title DESC NULLS LAST

Walau bagaimanapun, tiada pilihan kedudukan terbina dalam berdasarkan kedudukan istilah carian dalam rentetan (iaitu lajur tajuk).

KEDUDUKAN untuk menyelamatkan

Nasib baik ada fungsi POSITION dalam PostgreSQL. Fungsi PostgreSQL POSITION digunakan untuk mencari lokasi subrentetan dalam rentetan tertentu. Dalam kes kami, kami boleh menggunakannya seperti ini

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);

ts_rank menggunakan integer normalisasi 2 kerana 2 membahagikan pangkat dengan panjang dokumen
Nombor sihir 0.0001 adalah untuk mengelakkan pembahagian dengan 0 kerana fungsi POSTION dikira daripada 1 bukan 0 dan mengembalikan 0 jika rentetan tidak ditemui.

Kod akhir mungkin kelihatan seperti ini:

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);

Mencari lebih banyak istilah

Satu kaveat perlu disebut jika anda mencari lebih banyak istilah sekali gus (seperti JavaScript dan TypeScript).

Argumen untuk fungsi to_tsquery boleh digunakan dengan kefleksibelan yang besar, termasuk pengendali logik dll. Fungsi POSITION sebaliknya ialah "hanya" subrentetan dalam rentetan.

Contoh Dunia Nyata

Berikut ialah contoh saya dari titik akhir dunia sebenar dalam aplikasi web SvelteKit yang menggunakan perpustakaan npm postgres (sql):

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;

Berikut ialah pautan kepada dokumentasi dalam perkara:

  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-QUERIES https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-DOCUMENTS
  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-RANKING
  • https://www.postgresql.org/docs/9.1/functions-string.html

Atas ialah kandungan terperinci Kedudukan Carian Teks Penuh PostgreSQL mengikut Kedudukan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
C dan JavaScript: Sambungan dijelaskanC dan JavaScript: Sambungan dijelaskanApr 23, 2025 am 12:07 AM

C dan JavaScript mencapai interoperabilitas melalui webassembly. 1) Kod C disusun ke dalam modul WebAssembly dan diperkenalkan ke dalam persekitaran JavaScript untuk meningkatkan kuasa pengkomputeran. 2) Dalam pembangunan permainan, C mengendalikan enjin fizik dan rendering grafik, dan JavaScript bertanggungjawab untuk logik permainan dan antara muka pengguna.

Dari laman web ke aplikasi: Aplikasi pelbagai JavaScriptDari laman web ke aplikasi: Aplikasi pelbagai JavaScriptApr 22, 2025 am 12:02 AM

JavaScript digunakan secara meluas di laman web, aplikasi mudah alih, aplikasi desktop dan pengaturcaraan sisi pelayan. 1) Dalam pembangunan laman web, JavaScript mengendalikan DOM bersama -sama dengan HTML dan CSS untuk mencapai kesan dinamik dan menyokong rangka kerja seperti JQuery dan React. 2) Melalui reaktnatif dan ionik, JavaScript digunakan untuk membangunkan aplikasi mudah alih rentas platform. 3) Rangka kerja elektron membolehkan JavaScript membina aplikasi desktop. 4) Node.js membolehkan JavaScript berjalan di sisi pelayan dan menyokong permintaan serentak yang tinggi.

Python vs JavaScript: Gunakan Kes dan Aplikasi MembandingkanPython vs JavaScript: Gunakan Kes dan Aplikasi MembandingkanApr 21, 2025 am 12:01 AM

Python lebih sesuai untuk sains data dan automasi, manakala JavaScript lebih sesuai untuk pembangunan front-end dan penuh. 1. Python berfungsi dengan baik dalam sains data dan pembelajaran mesin, menggunakan perpustakaan seperti numpy dan panda untuk pemprosesan data dan pemodelan. 2. Python adalah ringkas dan cekap dalam automasi dan skrip. 3. JavaScript sangat diperlukan dalam pembangunan front-end dan digunakan untuk membina laman web dinamik dan aplikasi satu halaman. 4. JavaScript memainkan peranan dalam pembangunan back-end melalui Node.js dan menyokong pembangunan stack penuh.

Peranan C/C dalam JavaScript Jurubah dan PenyusunPeranan C/C dalam JavaScript Jurubah dan PenyusunApr 20, 2025 am 12:01 AM

C dan C memainkan peranan penting dalam enjin JavaScript, terutamanya digunakan untuk melaksanakan jurubahasa dan penyusun JIT. 1) C digunakan untuk menghuraikan kod sumber JavaScript dan menghasilkan pokok sintaks abstrak. 2) C bertanggungjawab untuk menjana dan melaksanakan bytecode. 3) C melaksanakan pengkompil JIT, mengoptimumkan dan menyusun kod hot-spot semasa runtime, dan dengan ketara meningkatkan kecekapan pelaksanaan JavaScript.

JavaScript in Action: Contoh dan projek dunia nyataJavaScript in Action: Contoh dan projek dunia nyataApr 19, 2025 am 12:13 AM

Aplikasi JavaScript di dunia nyata termasuk pembangunan depan dan back-end. 1) Memaparkan aplikasi front-end dengan membina aplikasi senarai TODO, yang melibatkan operasi DOM dan pemprosesan acara. 2) Membina Restfulapi melalui Node.js dan menyatakan untuk menunjukkan aplikasi back-end.

JavaScript dan Web: Fungsi teras dan kes penggunaanJavaScript dan Web: Fungsi teras dan kes penggunaanApr 18, 2025 am 12:19 AM

Penggunaan utama JavaScript dalam pembangunan web termasuk interaksi klien, pengesahan bentuk dan komunikasi tak segerak. 1) kemas kini kandungan dinamik dan interaksi pengguna melalui operasi DOM; 2) pengesahan pelanggan dijalankan sebelum pengguna mengemukakan data untuk meningkatkan pengalaman pengguna; 3) Komunikasi yang tidak bersesuaian dengan pelayan dicapai melalui teknologi Ajax.

Memahami Enjin JavaScript: Butiran PelaksanaanMemahami Enjin JavaScript: Butiran PelaksanaanApr 17, 2025 am 12:05 AM

Memahami bagaimana enjin JavaScript berfungsi secara dalaman adalah penting kepada pemaju kerana ia membantu menulis kod yang lebih cekap dan memahami kesesakan prestasi dan strategi pengoptimuman. 1) aliran kerja enjin termasuk tiga peringkat: parsing, penyusun dan pelaksanaan; 2) Semasa proses pelaksanaan, enjin akan melakukan pengoptimuman dinamik, seperti cache dalam talian dan kelas tersembunyi; 3) Amalan terbaik termasuk mengelakkan pembolehubah global, mengoptimumkan gelung, menggunakan const dan membiarkan, dan mengelakkan penggunaan penutupan yang berlebihan.

Python vs JavaScript: Keluk Pembelajaran dan Kemudahan PenggunaanPython vs JavaScript: Keluk Pembelajaran dan Kemudahan PenggunaanApr 16, 2025 am 12:12 AM

Python lebih sesuai untuk pemula, dengan lengkung pembelajaran yang lancar dan sintaks ringkas; JavaScript sesuai untuk pembangunan front-end, dengan lengkung pembelajaran yang curam dan sintaks yang fleksibel. 1. Sintaks Python adalah intuitif dan sesuai untuk sains data dan pembangunan back-end. 2. JavaScript adalah fleksibel dan digunakan secara meluas dalam pengaturcaraan depan dan pelayan.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual