最近,我遇到了全文搜尋的問題。我在搜尋輸入中使用此功能,後端會在您鍵入時發送可能匹配的提示。後端資料庫是PostgreSQL。我需要根據搜尋字詞在文字中的位置對提示進行排名。
因此,如果您搜尋“星球大戰”標題,您將首先看到“星球大戰”帖子,而不是“星球大戰7-9 如何改變星球大戰世界(一部關於星球大戰的有趣製作的紀錄片) ”,這可能會該詞出現3 次後排名更高。
PostgreSQL 中的全文搜索
PostgreSQL 中的全文搜尋可以輕鬆實現。主要使用兩個工具:
- tsvector - 表示可搜尋文件。
- tsquery - 表示針對文件執行的搜尋查詢。
假設我們要搜尋部落格文章的標題。為了使它們可搜索,我們可以使用以下查詢:
在這種情況下,我們會在每次搜尋時動態地將貼文標題轉換為 tsvector。然而,這種轉變需要一些時間。更好的方法是提前在資料庫中執行此轉換,並將其儲存為標題的索引,以便更快地搜尋。
讓我們建立一個新的標題向量列,並為這個新列建立索引:
現在嘗試搜尋術語「JavaScript」
您也可以直接在標題列上從 ts 向量建立索引,如下所示:
並使用這樣的搜尋:
現在,全文搜尋將非常快,只需幾毫秒即可完成。
對結果進行排名
PostgreSQL 提供了 ts_rank 功能,它允許您對搜尋結果進行評分並根據排名對其進行排序。 PostgreSQL 支援以下排名選項:
- 0(預設值)忽略文件長度
- 1 將排名除以 1 文件長度的對數
- 2 將排名除以文件長度
- 4 將排名除以範圍之間的平均調和距離(這僅由 ts_rank_cd 實現)
- 8 將排名除以文件中唯一單字的數量
- 16 將排名除以 1,即文件中唯一單字數量的對數
- 32 將排名除以 1
您可以像這樣使用 ts_rank:
但是,沒有基於搜尋字詞在字串中的位置(即標題列)的內建排名選項。
救援位置
幸運的是 PostgreSQL 中有 POSITION 函數。 PostgreSQL POSITION 函數用於尋找給定字串中子字串的位置。在我們的例子中,我們可以像這樣使用它
ts_rank 使用歸一化整數 2,因為 2 將排名除以文件長度
神奇數字 0.0001 是為了避免除以 0,因為 POSTION 函數從 1 開始計數,而不是從 0 開始計數,如果找不到字串,則傳回 0。
最終程式碼可能如下圖所示:
搜尋更多術語
如果您一次搜尋多個術語(例如 JavaScript 和 TypeScript),則必須提及一個警告。
to_tsquery 函數的參數可以非常靈活地使用,包括邏輯運算子等。另一方面,POSITION 函數「只是」字串中的一個子字串。
現實世界的例子
這是我在 SvelteKit Web 應用程式中來自現實世界端點的範例,該應用程式使用 postgres (sql) npm 庫:
以下是相關文件的連結:
- https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-QUERIES https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-DOCUMENTS
- https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-RANKING
- https://www.postgresql.org/docs/9.1/functions-string.html
以上是PostgreSQL 全文搜尋按位置排名的詳細內容。更多資訊請關注PHP中文網其他相關文章!

JavaScript在現實世界中的應用包括前端和後端開發。 1)通過構建TODO列表應用展示前端應用,涉及DOM操作和事件處理。 2)通過Node.js和Express構建RESTfulAPI展示後端應用。

JavaScript在Web開發中的主要用途包括客戶端交互、表單驗證和異步通信。 1)通過DOM操作實現動態內容更新和用戶交互;2)在用戶提交數據前進行客戶端驗證,提高用戶體驗;3)通過AJAX技術實現與服務器的無刷新通信。

理解JavaScript引擎內部工作原理對開發者重要,因為它能幫助編寫更高效的代碼並理解性能瓶頸和優化策略。 1)引擎的工作流程包括解析、編譯和執行三個階段;2)執行過程中,引擎會進行動態優化,如內聯緩存和隱藏類;3)最佳實踐包括避免全局變量、優化循環、使用const和let,以及避免過度使用閉包。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

Python和JavaScript在社區、庫和資源方面的對比各有優劣。 1)Python社區友好,適合初學者,但前端開發資源不如JavaScript豐富。 2)Python在數據科學和機器學習庫方面強大,JavaScript則在前端開發庫和框架上更勝一籌。 3)兩者的學習資源都豐富,但Python適合從官方文檔開始,JavaScript則以MDNWebDocs為佳。選擇應基於項目需求和個人興趣。

從C/C 轉向JavaScript需要適應動態類型、垃圾回收和異步編程等特點。 1)C/C 是靜態類型語言,需手動管理內存,而JavaScript是動態類型,垃圾回收自動處理。 2)C/C 需編譯成機器碼,JavaScript則為解釋型語言。 3)JavaScript引入閉包、原型鍊和Promise等概念,增強了靈活性和異步編程能力。

不同JavaScript引擎在解析和執行JavaScript代碼時,效果會有所不同,因為每個引擎的實現原理和優化策略各有差異。 1.詞法分析:將源碼轉換為詞法單元。 2.語法分析:生成抽象語法樹。 3.優化和編譯:通過JIT編譯器生成機器碼。 4.執行:運行機器碼。 V8引擎通過即時編譯和隱藏類優化,SpiderMonkey使用類型推斷系統,導致在相同代碼上的性能表現不同。

JavaScript在現實世界中的應用包括服務器端編程、移動應用開發和物聯網控制:1.通過Node.js實現服務器端編程,適用於高並發請求處理。 2.通過ReactNative進行移動應用開發,支持跨平台部署。 3.通過Johnny-Five庫用於物聯網設備控制,適用於硬件交互。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Dreamweaver Mac版
視覺化網頁開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3漢化版
中文版,非常好用

WebStorm Mac版
好用的JavaScript開發工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。