Heim >Java >javaLernprogramm >9 Java-basierte Suchmaschinen-Frameworks
In diesem Internetzeitalter, in dem Informationen ziemlich komplex sind, haben wir gelernt, wie wir die leistungsstarken Tools von Suchmaschinen nutzen können, um gezielte Informationen zu finden. Beispielsweise suchen Sie bei Google nach einer Möglichkeit, Ihrer Freundin und sich selbst eine Freude zu machen wird auch auf Baidu nach einer seriösen Klinik für plastische Chirurgie suchen (obwohl es da draußen viele Werbebetrüger gibt). Wenn Sie Benutzern also die Suche nach wichtigen Informationen in dem von Ihnen selbst entwickelten Website-System ermöglichen und den Benutzern strukturierte Ergebnisse präsentieren möchten, können Ihnen die 9 unten aufgeführten Java-Suchmaschinen-Frameworks möglicherweise weiterhelfen.
1. Java-Volltextsuchmaschinen-Framework Lucene
Es besteht kein Zweifel, dass Lucene derzeit das beliebteste Java-Volltextsuch-Framework ist. Um genau zu sein, handelt es sich um ein Volltextsuchsystem Suchmaschinenarchitektur, die eine vollständige Abfrage- und Indexierungsmaschine sowie einen Teil der Textanalysemaschine bereitstellt. Lucene stellt Entwicklern ein recht umfassendes Toolkit zur Verfügung, mit dem sich leistungsstarke Volltextsuchfunktionen problemlos implementieren lassen. Nachfolgend finden Sie mehrere Suchmaschinen-Frameworks, die ebenfalls auf Basis von Lucene implementiert sind.
Offizielle Website: http://lucene.apache.org/
2. Open-Source-Java-Suchmaschine Nutch
Nutch ist eine in Open-Source-Java implementierte Suchmaschine. Es bietet alle Tools, die wir zum Betrieb unserer eigenen Suchmaschine benötigen. Beinhaltet Volltextsuche und Web-Crawling.
Mit Nutch können Sie die folgenden Funktionen ausführen:
Jeden Monat Milliarden von Webseiten abrufen
Einen Index für diese Webseiten pflegen
Ja Index Dateien für Tausende von Suchvorgängen pro Sekunde
Bereitstellung hochwertiger Suchergebnisse
Betrieb mit minimalen Kosten
Offizielle Website: http://nutch.apache/
3. Verteilte Suchmaschine ElasticSearch
ElasticSearch ist eine verteilte Suchmaschine, die auf dem Lucene-Framework basiert, und außerdem eine der wenigen Suchmaschinen, die für die Indizierung auf JSON basieren. ElasticSearch eignet sich besonders für den Einsatz auf Cloud-Computing-Plattformen.
Offizielle Website: http://www.elasticsearch.org/
4. Verteilte Echtzeit-Suchmaschine Solandra
Solandra ist eine verteilte Echtzeit-Suchmaschine auf Apache Solr und Apache Cassandra Build.
Die Funktionen sind wie folgt:
Unterstützt die meisten Standardfunktionen von Solr (Suche, Facettierung, Hervorhebungen)
Datenreplikation, Sharding, Caching und Komprimierung werden alle von Cassandra bereitgestellt Führen Sie
Multi-Master durch (jeder Knoten kann gelesen und geschrieben werden)
Hohe Echtzeitleistung, lesen Sie, sobald der Schreibvorgang abgeschlossen ist
Fügen Sie ganz einfach neue SolrCores hinzu ohne Neustart im gesamten Cluster Einfaches Hinzufügen und Neustarten von Knoten
Offizielle Website: https://github.com/tjake/Solandra
5. IndexTank
IndexTank ist ein Satz von Javas Index - Echtzeit-Volltextsuchmaschinenimplementierung, IndexTank verfügt über die folgenden Funktionen:
Indexaktualisierungen werden in Echtzeit wirksam
Geografische Standortsuche
Unterstützt mehrere Clientsprachen
Ruby, Rails, Python, Java, PHP, .NET und mehr!
Unterstützt flexible Sortier- und Bewertungskontrolle
Unterstützt die automatische Vervollständigung
Unterstützt Facettensuche)
Unterstützt Übereinstimmungshervorhebung
Unterstützt eine massive Datenerweiterung (Skalierbar von einem persönlichen Blog auf Hunderte Millionen Dokumente!)
Unterstützt dynamische Daten
Offizielle Website: https://github.com/linkedin/indextank-engine
6. Suchmaschinenkompass
Compass ist ein leistungsstarkes, transaktionales, leistungsstarkes Objekt-/Suchmaschinen-Mapping (OSEM: Objekt-/Suchmaschinen-Mapping) und ein Java-Persistenzschicht-Framework. Compass umfasst:
Suchmaschinen-Abstraktionsschicht (Verwenden Sie Lucene Suchverweise)
OSEM (Object/Search Engine Mapping) unterstützt
Transaktionsmanagement
Eine einfache Keyword-Abfragesprache ähnlich wie Google
verfügbare Erweiterung und modular Framework
Einfache API
Offizielle Website: http://www.compass-project.org/
7. Java-Volltextsuchserver Solr
Solr basiert ebenfalls auf Java und basiert auf Lucene. Zu den Hauptfunktionen von Solr gehören: effiziente und flexible Caching-Funktion, vertikale Suchfunktion und hervorgehobene Suchergebnisse. Es ist erwähnenswert, dass Solr auch eine großartige Weboberfläche zur Verwaltung indizierter Daten bietet.
Offizielle Website: http://lucene.apache.org/solr/
8. Lucene-Bildsuche LIRE
LIRE ist ein Java-basiertes Bildsuch-Framework core basiert ebenfalls auf Lucene. Mit diesem Index können Sie ein inhaltsbasiertes Bildabrufsystem (CBIR) erstellen, um nach ähnlichen Bildern zu suchen.
Offizielle Website: http://www.semanticmetadata.net/lire/
9. Volltextsuchmaschine Egothor
Egothor ist ein Open-Source- und effizientes Tool in der Java-Volltextsuchmaschine. Mit den plattformübergreifenden Funktionen von Java kann Egothor auf Anwendungen in jeder Umgebung angewendet werden. Es kann als separate Suchmaschine konfiguriert oder in Ihrer Anwendung zur Volltextsuche verwendet werden.
Offizielle Website: http://www.egothor.org/cms/