ホームページ  >  記事  >  バックエンド開発  >  PHP 開発: Elasticsearch を使用して全文検索を実装する方法

PHP 開発: Elasticsearch を使用して全文検索を実装する方法

WBOY
WBOYオリジナル
2023-06-14 17:07:291177ブラウズ

最新の Web アプリケーションでは、データ量がますます増大していますが、ユーザーの期待とデータへのアクセスも同様に増大しています。したがって、ユーザーの期待に応え、より良いユーザー エクスペリエンスを提供するために、検索テクノロジーの重要性がますます高まっています。全文検索は、大量のデータのインデックス作成、検索、並べ替えを迅速に行うことができる強力なテクノロジです。この点において、Elasticsearch は、多くの高度な機能、高可用性、容易なスケーラビリティ、その他の利点を提供する主要なオープンソース検索エンジンです。

この記事では、Elasticsearchを使用してPHPで全文検索を実現する方法を紹介します。 Elasticsearch や PHP のインストールなどの環境設定から始め、インデックス作成、検索、分析の 3 つの主要な側面から詳しく説明します。

1. 環境設定

まず、Elasticsearch をローカルまたはサーバーにインストールします。 Elasticsearch は、公式 Web サイトまたはパッケージ マネージャーからダウンロードしてインストールできます。

2 番目に、Composer を介して Elasticsearch の PHP クライアント (elasticsearch-php) をインストールします。これには、Elasticsearch API を呼び出すための便利なメソッドとクラスが多数用意されています。

composer require elasticsearch/elasticsearch

インストールが完了したら、PHP ファイルで次の設定を行います:

require 'vendor/autoload.php';

$client = ElasticsearchClientBuilder::create()->build();

このようにして、Elasticsearch サーバーと通信するクライアントが作成されます。

2. インデックス

Elasticsearch では、インデックスはデータを保存し、迅速に検索するために使用されるデータ コレクションです。 elasticsearch-php の API を使用してインデックスにデータを挿入できます。

  1. インデックスの作成

まず、新しいインデックスを作成する必要があります。次のコードを使用して、「my_index」という名前のインデックスに「my_type」という名前の型を作成します。

#$params = [

'index' => 'my_index',
'body'  => [
    'mappings' => [
        'my_type' => [
            'properties' => [
                'title' => ['type' => 'text'],
                'body'  => ['type' => 'text'],
            ]
        ]
    ]
]

];

$response = $client->indices()->create($params);

# #「properties」配列の「title」フィールドと「body」フィールドは「text」タイプであり、全文インデックスが付けられることを意味します。実際には、特定のニーズに応じてインデックスとフィールド タイプを設定します。

このようにして、「my_index」という名前のインデックスが正常に作成されました。

ドキュメント データをインデックスに追加します
  1. 次のコードを使用してドキュメントをインデックスに挿入します:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'title' => 'PHP Elasticsearch 全文检索',
    'body'  => 'Elasticsearch 是一个领先的全文搜索引擎,其功能包括分布式、高可用、实时搜索和分析能力等。',
]

];

$response = $client->index($params);

ここでは、タイトルと本文を含むドキュメントをインデックスに挿入します。

ドキュメントの更新
  1. インデックス内の既存のドキュメントを更新する必要がある場合は、次のコードを使用します:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'id'    => '1',
'body'  => [
    'doc' => [
        'title' => '修改后的标题',
        'body'  => '修改后的正文内容',
    ]
]

];

$response = $client->update($params);

更新時にドキュメントの ID を指定する必要があることに注意してください。

ドキュメントの削除
  1. 既存のドキュメントを削除する必要がある場合は、次のコードを使用します:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'id'    => '1'

] ;

$response = $client->delete($params);

このようにして、インデックスとドキュメントの作成、挿入、更新、削除が完了しました。

3. 検索

elasticsearch-php API を使用して検索する方法を見てみましょう。

単純なクエリ
  1. まず、単純なクエリを実行しましょう:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ]
]

];

$response = $client->search($params);

上記のコードでは、一致クエリを実行して、インデックス内の "PHP" キーワードを含むすべてのドキュメントをクエリします。検索結果は $response 変数に保存されます。

複数条件クエリ
  1. 複数の条件をクエリする必要がある場合は、bool クエリを使用して複数の条件を組み合わせることができます:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'bool' => [
            'must' => [
                [ 'match' => [ 'title' => 'PHP' ] ],
                [ 'match' => [ 'body'  => '搜索引擎' ] ]
            ]
        ]
    ]
]

];

$response = $client->search($params);

ここでは、同時に満たす必要がある 2 つのクエリ条件を指定します。必須パラメータを介して。

ページ分けクエリ
  1. データ量が多い場合は、検索結果をページ分けできます:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'from' => 0, 'size' => 10,
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ]
]

];

$response = $client->search($params);

from パラメーターと size パラメーターを使用して、結果セットのオフセットとサイズを指定します。

スコアによる並べ替え
  1. より正確な検索結果を得るために、Elasticsearch は各ドキュメントの関連性スコアを計算します。評価による並べ替えは、次のコードで行うことができます:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ],
    'sort'  => [
        '_score' => [ 'order' => 'desc' ]
    ]
]

];

$response = $client->search($params);

このようにして、クエリ結果は関連性スコアに基づいて高いものから低いものへと並べ替えられます。

4. 分析

Elasticsearch は、データセットに関するより深い情報を取得するために使用できる、さまざまな強力な分析および集計関数をサポートしています。

集計
  1. 次のコードは、「タイトル」フィールドで出現頻度が最も高い上位 10 個の単語を取得できます。

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'size'  => 0,
'body'  => [
    'aggs' => [
        'top_titles' => [
            'terms' => [
                'field' => 'title.keyword',
                'size'  => 10
            ]
        ]
    ]
]

];

$response = $client->search($params);

サイズ パラメーターを指定して、ドキュメントを返すことをスキップし、集計された結果のみを返します。

アナライザー
  1. Elasticsearch には、テキストを分析および処理するための強力なアナライザーも多数提供されています。次のコードは、中国語パーサーを使用してテキストを処理する方法を示しています。

$params = [

'index' => 'my_index',
'body'  => [
    'settings' => [
        'analysis' => [
            'analyzer' => [
                'my_analyzer'   => [
                    'type'      => 'custom',
                    'tokenizer' => 'ik_max_word'
                ]
            ]
        ]
    ]
]

];

$response = $client->indices() - >putSettings($params);

这里,我们为名为“my_analyzer”的分析器指定了“ik_max_word”分词器。

下面的代码可以使用这个分析器来分析文本:

$params = [

'index' => 'my_index',
'body'  => [
    'query' => [
        'query_string' => [
            'query'         => '搜索',
            'analyzer'      => 'my_analyzer',
            'default_field' => 'title'
        ]
    ]
]

];

$response = $client->search($params);

这样,我们就可以使用中文分析器来分析中文文本了。

总结

在本文中,我向您介绍了如何使用elasticsearch-php的API来创建、添加、更新和删除索引和文档,以及如何使用搜索API来执行简单和复杂的查询。此外,我还介绍了使用聚合和分析器来处理数据的相关技术。

随着数据集规模的增加,Elasticsearch的重要性逐渐增加。只要您熟悉它的API,您就可以通过PHP轻松地利用其强大的搜索和分析能力来优化您的Web应用程序。

以上がPHP 開発: Elasticsearch を使用して全文検索を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。