ホームページ >データベース >mysql チュートリアル >MySQL 全文インデックス アプリケーションに関する簡単なチュートリアル

MySQL 全文インデックス アプリケーションに関する簡単なチュートリアル

黄舟
黄舟オリジナル
2016-12-15 16:18:211236ブラウズ

この記事では、MySQL フルテキスト インデックスの基本的な知識を次の側面から紹介します。

1. MySQL フルテキスト インデックスに関するいくつかの注意事項

2. フルテキスト インデックスの構文

3. いくつかの検索の概要タイプ

4. いくつかの検索タイプの例


フルテキスト インデックスに関するいくつかの注意点

1. 検索はフルテキスト タイプのインデックス列に対して行う必要があり、match で指定された列はフルテキストで指定されている必要があります。

2. テーブル エンジンが MyIsam タイプのテーブルにのみ適用されます (MySQL 5.6 以降は Innodb テーブル エンジンでも使用できます)

3. フルテキスト インデックスは、char、varchar、および text タイプの列にのみ作成できます。

4. 通常のインデックスと同様に、テーブルの定義時に指定することも、テーブルの作成後に追加または変更することもできます。 5. 大規模なレコードの挿入の場合、インデックスなしでテーブルにデータを挿入します。インデックスを作成する方が、インデックスを使用してデータ テーブルに挿入するよりもはるかに高速です

6. 検索文字列はテーブルの列名ではなく、定数文字列である必要があります

7.レコードが50%を超えた場合は一致しないものとみなされます(自然検索のみに限る)


全文インデックス検索構文

MATCH (列名1, 列名2,…) AGAINST (搜索字符串 [搜索修饰符])

matchで指定した列名1、2などは、全文インデックスの作成時に指定される列名については、次のように説明されています:

search_modifier:
{
IN NATURAL LANGUAGE MODE
| IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION
| IN BOOLEAN MODE
| WITH QUERY EXPANSION
}

いくつかの検索タイプの紹介

上記の検索修飾子は、実際には 3 つの全文検索タイプを示しています

自然言語モードで

はじめに: デフォルトの検索フォーム (検索修飾子がないか、修飾子が自然言語モードになっています)

特徴:

検索文字列内の文字はすべて、特別な意味を持たずに通常の文字に解析されます

文字列をフィルタリングしますマスクされた文字リスト

レコードの選択性が 50% を超える場合、通常は不一致とみなされます。

返されたレコードは関連性に従って並べ替えられ、表示されます

ブールモードで

概要: ブールモード検索 (検索修飾子がブールモードの場合)

特徴:

は特定のルールに従って検索文字列を解析します特殊文字の意味は、いくつかの論理的な意味の規則に従います。たとえば、特定の単語は出現する必要がある、または出現できない、などです。

このタイプの検索で返されるレコードは、関連性に従って並べ替えられません

クエリ拡張あり

概要: 実際に 2 つの自然検索を実行し、性的関係のレコードを直接返すことができる、少し複雑な検索フォーム。自然言語モードの修飾子 WITH QUERY EXPANSION または WITH QUERY EXPANSION 修飾子

特徴: このタイプの検索は、実際には間接検索機能を提供します。たとえば、特定の単語を検索すると、返される最初の行には検索単語が含まれません。最初の検索結果のレコード語に基づいて 2 番目の照合を実行できるため、間接的な関係を持つ一致するレコードを見つけることができます。

いくつかの検索タイプの例

自然言語モード モードでのアプリケーション:

これは、名前フィールドに全文インデックスを確立した製品テーブルに引き続き適用されます。これは、関連するキーワードに一致する必要があるためです。 name 列 次のように

Sql ステートメントを記録します:

SELECT * FROM product WHERE match(name) against(‘auto')

時間は悪くありません。約 870,000 レコード中 10,000 レコード以上がヒットしました。所要時間は 1.15 秒で、効果は依然として良好です

注: デフォルトでは、相関に基づいています。レコードは高い方から低い方へ返されます

product から match(name) between('auto') を選択して、レコードの相関値を表示できます。値は 0 から 1 の間です。 0 はレコードが一致しないことを意味します

いくつかの重要な機能:

1. どの単語が無視されるか

デフォルトの全文インデックスは 4 文字を超える単語を有効な単語として考慮します。構成内の ft_min_word_len を変更して、語彙リスト内の

ブロック単語を構成します。 デフォルトのフルテキスト インデックスでは、一部の一般的な単語がブロックされます。これらの単語はあまりにも一般的であり、意味的な効果がないため、検索プロセスでは無視されます。もちろん、このリストは構成可能です。

2. 単語の分割を実行する方法

フルテキスト インデックスは、連続する有効な文字 (正規表現の w と一致する文字セット) を単語とみなし、これには "'" が含まれる場合もあります。 ただし、2 つの連続した ' は区切り文字とみなされます。その他の区切り文字: スペース、カンマ、ピリオドなど。

ブール モード モードのアプリケーション:

ブール マッチング モードでは、特殊な記号を追加して、検索プロセスの論理機能を強化できます。公式 Web サイトで提供されている例など (mysql と (Yousql ステートメントを除く):

SELECT * FROM articles WHERE MATCH (title,body)
-> AGAINST (‘+MySQL -YourSQL' IN BOOLEAN MODE);

検索をより細かく制御でき、より「ハイエンド」に見えることがわかります。

実際、上記の操作にはいくつかの意味が含まれています:

プラス記号: and と同等

マイナス記号: not と同等

いいえ: or と同等

ブール型検索のいくつかの重要な機能を見てみましょう:

1. 没有50%记录选择性的限制,即使搜索结果记录超过总数的50%也同样返回结果
2. 不会自动的按记录的相关性进行降序排序
3. 可以直接应用在没有创建fulltext的全文索引上,但是这样会查询的非常慢,所以说还是别用了。
4. 支持最小、最大单词长度
5. 应用屏蔽词列表

布尔搜索支持的操作符:

n 加号 +:指示修饰的单词必须出现在记录中
n 减号 -:指示修饰的单词必须不能出现在记录中
n 没有任何操作符:单词可有可无,但是包含该词的记录相关性高
n 双引号 “ : 将一个词组作为一个匹配。如:”one word” 匹配one word在一起的单词

下面是官方的一些实例:

至少包含一个词的记录
‘apple banana'
   
必须包含着两个词
‘+apple +juice'
   
必须包含apple,包含macintosh的记录相关性高,也可以不包含
‘+apple macintosh'
   
必须包含apple且不能喊有macintosh
‘+apple -macintosh'
   
查找apple开头单词的记录
‘apple*'
   
完整匹配some words单词
‘”some words”‘

   

了解了基本的mysql全文索引知识,觉得它的全文索引比like当然是强了很多。但是面对高级的搜索还是略显简陋,且性能问题也是担忧。

以上就是MySQL全文索引应用简明教程的内容,更多相关文章请关注PHP中文网(www.php.cn)!


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。