ホームページ >Java >&#&チュートリアル >9 つの Java ベースの検索エンジン フレームワーク
情報が非常に複雑になっているこのインターネット時代において、私たちは検索エンジンという強力なツールを使って目的の情報を見つける方法を学びました。たとえば、Google でバレンタインデーを検索したり、彼女を喜ばせる方法を見つけたりすることもできます。 Baidu で美容医療機関の公式情報を検索してください (ただし、広告詐欺師が多数を占めています)。そのため、独自に開発した Web サイト システムでユーザーが重要な情報を検索できるようにし、構造化された結果をユーザーに表示できるようにする必要がある場合は、以下で共有する 9 つの Java 検索エンジン フレームワークが役立つ可能性があります。
1. Java 全文検索エンジン フレームワーク Lucene
Lucene が現在最も人気のある Java 全文検索フレームワークであることは疑いの余地がありません。正確に言うと、完全なクエリを提供する全文検索エンジン アーキテクチャです。エンジンとインデックス作成エンジン、テキスト分析エンジンの一部。 Lucene は、強力な全文検索機能を簡単に実装できる、かなり完全なツールキットを開発者に提供します。以下に示すいくつかの検索エンジン フレームワークも Lucene に基づいて実装されています。
公式サイト:http://lucene.apache.org/
2.オープンソースJava検索エンジンNutch
NutchはオープンソースJavaで実装された検索エンジンです。独自の検索エンジンを実行するために必要なすべてのツールを提供します。全文検索と Web クローリングが含まれます。
Nutch を利用すると、次の機能を実行できます:
毎月数十億の Web ページを取得する
これらの Web ページのインデックスを維持する
インデックス付けされたファイルを 1 秒あたり数千回検索する
高品質の検索結果を提供する
最小限のコストで動作します
公式 Web サイト: http://nutch.apache.org/
3. 分散検索エンジン ElasticSearch
ElasticSearch は、Lucene フレームワークに基づく分散検索エンジンであり、また、数少ない分散検索エンジンの 1 つですJSON インデックスに基づく検索エンジン。 ElasticSearch は、クラウド コンピューティング プラットフォームでの使用に特に適しています。
公式サイト:http://www.elasticsearch.org/
4. リアルタイム分散検索エンジン Solandra
Solandra は、Apache Solr と Apache Cassandra 上に構築されたリアルタイム分散検索エンジンです。
その機能は次のとおりです:
Solr のデフォルト機能のほとんどをサポート (検索、ファセット、ハイライト)
データのレプリケーション、シャーディング、キャッシュ、圧縮はすべて Cassandra によって実行されます
マルチマスター (どのノードでも読み取りと書き込み)
高いリアルタイムパフォーマンス、書き込み操作が完了するとすぐに書き込み操作を読み取ることができます
クラスター全体で再起動せずに新しい SolrCore を簡単に追加できますノードの追加と再起動が簡単です
公式ウェブサイト: https:/ /github.com/tjake /Solandra
5. IndexTank
IndexTank は Java ベースのインデックスリアルタイム全文検索エンジンの実装であり、次の機能があります:
インデックスの更新はリアルタイムで有効になります
。地理的位置検索
複数のクライアント言語をサポート
Ruby、Rails、Python、Java、PHP、.NETなど!
柔軟な並べ替えとスコアリング制御をサポート
オートコンプリートをサポート
ファセット検索をサポート
一致ハイライトをサポート
大規模なデータ拡張をサポート (個人のブログから数億のドキュメントまで拡張可能!)
動的データをサポート
公式ウェブサイト: https://github.com/linkedin/indextank-engine
6. 検索エンジン Compass
Compass は、強力でトランザクション対応の高性能のオブジェクト/検索エンジン マッピング (OSEM: オブジェクト/検索エンジン マッピング) であり、Java 永続層フレームワークが含まれています:
検索エンジン抽象化層 (Lucene 検索参照を使用)
OSEM。 (オブジェクト/検索エンジン マッピング)
Google のシンプルなキーワード クエリ言語に似たトランザクション管理
をサポート
拡張可能なモジュール式フレームワーク
シンプルな API
公式ウェブサイト: http://www.compass-project.org/
7. Java 全文検索サーバー Solr
Solr も Java に基づいて実装されており、Lucene に基づいて実装されています。 Solr の主な機能には、効率的で柔軟なキャッシュ機能、垂直検索機能、検索結果のハイライト表示が含まれます。 Solr は、インデックス付きデータを管理するための優れた Web インターフェイスも提供していることは注目に値します。
公式サイト:http://lucene.apache.org/solr/
8. Lucene 画像検索 LIRE
LIRE は Java ベースの画像検索フレームワークであり、そのコアも Lucene に基づいています。コンテンツベースの画像検索 (CBIR) システムを構築して、類似した画像を検索します。
公式サイト: http://www.semanticmetadata.net/lire/
9. 全文検索エンジン Egothor
Egothor は、Java で書かれたオープンソースの効率的な全文検索エンジンです。 Java のクロスプラットフォーム機能により、Egothor はあらゆる環境のアプリケーションに適用でき、別個の検索エンジンとして構成したり、アプリケーションで全文検索に使用したりできます。
公式サイト:http://www.egothor.org/cms/