首頁 >資料庫 >mysql教程 >MySQL中如何計算字串相似度百分比?

MySQL中如何計算字串相似度百分比?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-12-30 17:59:09222瀏覽

How to Calculate String Similarity Percentage in MySQL?

如何在MySQL 中計算字串相似度

問題:

My決定它們的值相似度百分比。例如,給定字串“@a = 'Welcome to Stack Overflow'”和“@b = 'Hello to stack Overflow'”,您想要找到它們之間的相似性。

解決方案:

  1. 建立編輯距離函數:

    使用下列函數計算兩個字串之間的編輯距離:

    CREATE FUNCTION `levenshtein`(s1 text, s2 text) RETURNS int(11)
    DETERMINISTIC
    BEGIN 
    ...
    END

    上述函數改編自提供的函數http://www.artfulsoftware.com/infotree/queries.php#552.

  2. 創建Levenshtein 相似度函數:

    至將 Levenshtein距離轉換成相似度,使用這個函數:

    CREATE FUNCTION `levenshtein_ratio`( s1 text, s2 text ) RETURNS int(11)
    DETERMINISTIC
    BEGIN 
    ...
    END

用法:

要計算兩個字串之間的相似度百分比,請使用以下公式:

similarity_percentage = ((1 - LEVENSHTEIN(s1, s2) / MAX_LENGTH) * 100)
  • LEVENSHTEIN(s1, s2):計算兩個字串之間的編輯距離。
  • MAX_LENGTH:兩個字串的最大長度。

範例:

SELECT levenshtein_ratio('Welcome to Stack Overflow', 'Hello to stack overflow') AS similarity;

這個查詢會傳回兩個字串之間的相似度百分比,在本例中為 66%。

以上是MySQL中如何計算字串相似度百分比?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn