ホームページ  >  記事  >  バックエンド開発  >  PHP+Sphinx+Mysqlによる検索エンジン開発の具体例解説

PHP+Sphinx+Mysqlによる検索エンジン開発の具体例解説

韦小宝
韦小宝オリジナル
2018-02-10 10:39:566430ブラウズ

誰もが検索エンジンについて書くのは難しく、まったくわからないでしょう。実際、PHP は検索エンジンの開発にも使用できますが、私たちが望む検索エンジンを開発するには、PHP を sphinx や mysql と組み合わせる必要があります。 PHP がどのように動作するかを知りたい 検索エンジンの開発を行っていますか?見てみましょう! !

まず、Sphinx ツールをダウンロードします。ダウンロード アドレスは公式 Web サイトのダウンロード アドレス: www.sphinxsearch.com、sphinx-2.2.10-release-win64.zip を見つけて、これを 64 ビット用にダウンロードし、PHP 実行ディレクトリに解凍します。 , 結果は後続のWebページで確認できるので便利です。

sphinx の紹介:

Sphinx は SQL Phrase Index (クエリ フレーズインデックス) の略称で、SQL に基づいた全文検索エンジンです。PHP、Python、Perl、 Ruby、Java など。同時に、分散型全文検索システムである MySQL 用にエンジン プラグイン SphinxSE が設計されました。
利点:
高速インデックス作成は 10M/s に達します
高性能検索 (2-4G テキストデータでは、平均取得応答時間は 0.1 秒未満)
大規模な処理が可能データ (現在、単一の CPU システムで 100G のテキスト データと 100M のドキュメントを処理できることがわかっています)
優れた相関アルゴリズム、フレーズの類似性と統計的 BM2 に基づく複合ランキング手法を提供します
分散検索をサポートします
ドキュメントフラグメント生成機能を提供します
検索サービスを提供するための MySQL ストレージエンジンとして使用できます
ブール値、フレーズ、単語の類似性、その他の検索モードをサポートします
欠点:
主キーが必要です
主キーは整数である必要があります
データストレージを担当しません
構成は柔軟ではありません

解凍後のスフィンクス構造は図に示すとおりです:


以下は私たちのものです関連する設定、図の sphinx-min.conf.in を参照し、後で簡単に使用できるように bin ディレクトリにコピーし、名前を sphinx.conf に変更します。

中の内容を変更します:

source src1
{
	type			= mysql

	sql_host		= localhost #主机地址
	sql_user		= root#帐号
	sql_pass		=     #密码
	sql_db			= sphinx  #数据库
	sql_port		= 3306	# 数据库端口 3306
	sql_query		= SELECT id, name, age FROM users #查询语句
	sql_attr_uint		= group_id
	sql_attr_timestamp	= date_added
	sql_query_pre = set names utf8   #数据库编码
}


index test1
{
	source			= src1
	path			= D:/myapaphe/www/sphinx/data #这个一定要配置
	charset_type = utf-8 #指定编码
	ngram_len = 1        #要找中文需指定为1.
	ngram_chars = U+3000..U+2FA1F
	
}

indexer
{
	mem_limit		= 128M
}
searchd
{
	listen			= 9312
	listen			= 9306:mysql41
	log			= D:\myapaphe\www\sphinx\log\searchd.log  #进程日志
	query_log		= D:\myapaphe\www\sphinx\log\query.log    #查询日志

	read_timeout		= 5
	max_children		= 30
	pid_file		= D:\myapaphe\www\sphinx\log\searchd.pid 
	seamless_rotate		= 1
	preopen_indexes		= 1
	unlink_old		= 1
	workers			= threads # for RT to work
	binlog_path		= D:\myapaphe\www\sphinx\data
}

上記を設定する必要があります。パス それはあなた自身のパスと一致している必要があります。

次にクエリインデックスを生成します:


searchd サービスをインストールします:


次に 設定ファイル をロードします:


サービスを開始します:


OK 前回の設定作業とサービスの起動が完了しましたので、コードを開始します:

sphinx の下の api フォルダーに test3.php を作成し、test3.php を実行します


文字化けは、cmd のデフォルトが原因です。 gbk エンコーディングをブラウザに入れて表示してみましょう:


Sphinx は完全な結果を見つけられませんが ID を返し、ID に基づいてデータを確認できることがわかります。

クエリ時間を比較してみましょう:


40,000 個を超えるデータでテストした時間は 0.001 秒です。mysql クエリにかかる時間を見てみましょう:


時間がかかることがわかります。 0.04 秒、データが少ないため、結果はそれほど明らかではありませんが、0.039 秒の差は小さくありません。

これで Sphinx の統合が完了しました。皆さんのお役に立てれば幸いです。

関連するおすすめ:

php 既存の検索エンジンを呼び出す詳細な説明

訪問者が検索エンジンスパイダーかどうかを判断するためのphp関数コード

以上がPHP+Sphinx+Mysqlによる検索エンジン開発の具体例解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。