目標:增強 MySQL 搜尋以傳回按與給定搜尋字詞的相似度排名的結果。
挑戰:建立一個能夠有效識別相似字串並按相關性對結果進行排序的搜尋引擎。
解:
1。外部搜尋引擎:
考慮提供進階功能的外部搜尋引擎:
2。 MySQL 全文索引:
使用MySQL內建的全文索引進行高效率的字串比對。建立臨時 MYISAM 表(以啟用全文搜尋):
<code class="language-sql">ALTER TABLE data_table_temp ADD FULLTEXT FTK_title_description (title, description);</code>
3。最佳化查詢:
全文搜尋:
使用帶有布林模式的 MATCH AGAINST
運算子進行基於相似性的搜尋:
<code class="language-sql">SELECT *, MATCH (title, description) AGAINST ('+so* +nullam lorem') AS score FROM data_table_temp WHERE MATCH (title, description) AGAINST ('+so* +nullam lorem') ORDER BY score DESC;</code>
編輯距離和 LIKE
:
雖然 Levenshtein 距離對於部分匹配並不理想,並且 LIKE
可能會錯過較長的字串,但它們可能適合特定情況。
進一步考慮:
Lucene 索引維護:
為 Lucene 索引安排定期更新(例如,使用 cron 作業),因為它們不是即時的。
搜尋分析器配置:
選擇合適的分析器來微調搜尋行為(區分大小寫、語言支援、停用詞刪除)。
限制:
最佳解決方案取決於您的特定需求。在做出決定之前仔細權衡每種方法的優點和缺點。
以上是如何增強 MySQL 搜尋功能以傳回相似性排序的結果?的詳細內容。更多資訊請關注PHP中文網其他相關文章!