MySQL でレーベンシュタイン距離を使用して文字列の類似性パーセンテージを計算するにはどうすればよいですか?-mysql チュートリアル-php.cn

ホームページ

データベース

mysql チュートリアル

MySQL でレーベンシュタイン距離を使用して文字列の類似性パーセンテージを計算するにはどうすればよいですか?

Patricia Arquette

Dec 13, 2024 am 05:48 AM

How can I Calculate String Similarity Percentage in MySQL using Levenshtein Distance?

MySQL での文字列の類似性の計算

MySQL のようなデータベース管理システムでは、テキスト文字列の類似性を比較することが一般的な要件です。この記事では、MySQL 関数を使用して 2 つの文字列間の類似性のパーセンテージを計算する多用途のアプローチについて説明します。

レーベンシュタイン距離を使用した文字列の類似性の計算

レーベンシュタイン距離は、編集 (挿入) の数を測定するメトリックです。、削除、または置換）は、ある文字列を別の文字列に変換するために必要です。類似性スコアが高いほど、文字列間の類似性が高いことを示します。

MySQL では、LEVENSHTEIN() 関数は 2 つの文字列間のレーベンシュタイン距離を計算します。類似性のパーセンテージを取得するには、次の式を使用できます。

Similarity Percentage = (1 - (Levenshtein Distance / Length of Longest String)) * 100

MySQL 実装

このアプローチを MySQL に実装するには、次の 2 つの関数を作成します:

レーベンシュタイン()関数:

CREATE FUNCTION `LEVENSHTEIN`(s1 TEXT, s2 TEXT) RETURNS INT(11)
DETERMINISTIC
BEGIN
    # ... Function implementation ...
END;

LEVENSHTEIN_RATIO() 関数:

CREATE FUNCTION `LEVENSHTEIN_RATIO`(s1 TEXT, s2 TEXT) RETURNS INT(11)
DETERMINISTIC
BEGIN
    # ... Function implementation ...
END;

使用例

質問に示されている例を考慮してください。

SET @a = "Welcome to Stack Overflow";
SET @b = "Hello to stack overflow";

類似度を計算するクエリ@a と @b の間のパーセンテージは次のようになります。

SELECT LEVENSHTEIN_RATIO(@a, @b) AS SimilarityPercentage;

このクエリは値 60 を返し、2 つの文字列間の類似性が 60% であることを示します。

以上がMySQL でレーベンシュタイン距離を使用して文字列の類似性パーセンテージを計算するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

MySQL文字列タイプ：ストレージ、パフォーマンス、ベストプラクティスMay 10, 2025 am 12:02 AM

mysqlstringTypesimpactStorageandperformanceAseasfollows：1）churisfixed-regents、whuscanbasterbutlessspace-efficient.2）varcharisvariaible、morespace-efficient-butpotentiallyslower.3）Textisforgergetext、storedoutext、

MySQL文字列タイプの理解：Varchar、Text、CharなどMay 10, 2025 am 12:02 AM

mysqlstringTypesincludevarchar、テキスト、char、列挙、およびセット。1）varcharisSatileforvariaible-lengthstringsuptoaspoecifedlimit.2）TextisidealforLargetExtStorageWithDeinLength.3）charispixed-consinterconsistentalikodes.4）

MySQLの文字列データ型は何ですか？May 10, 2025 am 12:01 AM

mysqloffersvariousstringdatatypes：1）charfixed-lengthstrings、2）varcharforvariable-lengthtext、3）binaryandvartyforbinarydata、4）blobandtextforlargedata、and5）enumandsetforControlledinput.

新しいMySQLユーザーに権限を付与する方法May 09, 2025 am 12:16 AM

tograntpermissionstonewmysqlusers、フォローステープ：1）Accessmysqlasauserwithsufthiveerprivileges、2）createanewuser withthecreateusercommand、3）usethegrantcommandtospecifypermissionsionsionsionsionsionsionsionsionsionsionselect、挿入、挿入、挿入、更新、4）

MySQLにユーザーを追加する方法：ステップバイステップガイドMay 09, 2025 am 12:14 AM

toadduusersinmysqucrectivally andcurally、soflowthesteps：1）usethecreateuserstatementtoaddanewuser、指定するhostandastrongpassword.2）補助金を使用して、補助金を使用して、補助すること、

MySQL：複雑な権限を持つ新しいユーザーの追加May 09, 2025 am 12:09 AM

toaddanewuserwithpermissionsinmysql、followthesesteps：1）createtheuserwithcreateuser'newuser '@' localhost'identifiedifiedifiedifiedby'pa ssword ';。2）grantreadacestoalltablesin'mydatabase'withgrantselectonmydatabase.to'newuser'@'localhost';。3）grantwriteaccessto '

MySQL：文字列データ型とコレクションMay 09, 2025 am 12:08 AM

MySQLの文字列データ型には、CHAR、VARCHAR、バイナリ、Varbinary、BLOB、およびテキストが含まれます。照合は、文字列の比較とソートを決定します。 1.Charは固定長の文字列に適しており、Varcharは可変長文字列に適しています。 2.バイナリとVarbinaryはバイナリデータに使用され、BLOBとテキストは大規模なオブジェクトデータに使用されます。 3. UTF8MB4_UNICODE_CIなどのルールのソートは、高度と小文字を無視し、ユーザー名に適しています。 UTF8MB4_BINは症例に敏感であり、正確な比較が必要なフィールドに適しています。

MySQL：Varcharsにはどの長さを使用すればよいですか？May 09, 2025 am 12:06 AM

最適なMySQLVarcharの列の長さの選択は、データ分析に基づいており、将来の成長を検討し、パフォーマンスの影響を評価し、文字セットの要件を評価する必要があります。 1）データを分析して、典型的な長さを決定します。 2）将来の拡張スペースを予約します。 3）パフォーマンスに対する大きな長さの影響に注意してください。 4）ストレージに対する文字セットの影響を考慮します。これらの手順を通じて、データベースの効率とスケーラビリティを最適化できます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

WebStorm Mac版

便利なJavaScript開発ツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。