大数据已经上升到一场国家战略, 近年来,伴随着物联网、云计算、移动互联网等新技术的迅猛发展,数据正以前所未有的速度不断增长和积累,大数据时代已经到来,这引起了产业界学术界科技界和政府机构的广泛关注。
数据从简单的处理对象开始转变为一种基础性资源,如何更好地管理和利用大数据已经成为普遍关注的话题.大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,而检索引擎是大数据高效管理和智能分析的基础,同时需要针对大数据特点(海量、数据异构多样性、应用需求多样性)进行设计,开发面向大数据的高效、可靠、智能的检索引擎。
JZSearch精准搜索引擎是针对大数据搜索业务需求而打造的一套搜索引擎,,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持丰富的查询语言和查询类型,支持少数民族语言的搜索。
同时,全文搜索中间件通过可视化界面,可以快速地配置相关参数,启动搜索服务,并提供测试程序,可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。
其主要特性包括:
1、可以按照任意指定字段的排序,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;
2、支持精确匹配以及模糊匹配,默认为精确匹配,忽略字母大小写进行模糊匹配;
3、内嵌正负面情感等极性分析,也可以支持类别搜索;
4、语义联想搜索:如搜索“马铃薯”可以同时返回“土豆”的内容,搜索“北京市”可以返回“北京”或者“首都”的内容;语义联系词表用户可以根据业务需要进行定制;
5、支持增量索引:系统可以在搜索服务不停的前提下,继续索引新的数据,索引完成后,可以搜索新的数据;
6、自动备份与恢复机制,在建立索引和自动优化之前,系统会将已有的索引文件自动备份;在当前索引文件被破坏无法搜索的前提下,系统将自动恢复上次搜索正常的备份文件;
7、自动缓存机制:系统自动保存最近常用的搜索条件与结果,再次搜索时将直接推送搜索结果内容,可以将搜索响应速度提升30%以上;缓存会随着新的索引数据自动更新,不存在缓存延迟问题;
8、自动优化机制:在系统索引碎片较多时,系统会自动优化归并;
9、实现的是多线程搜索服务;
10、兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQL,DB2等。
11、支持Windows/Linux/FreeBSD等操作系统,支持C/C++/C#/Java二次开发。
JZSearch精准搜索引擎系统配置操作
第一步:配置数据库读取参数
配置数据库信息,结果写入index\dbConf.xml
第二步:数据库字段信息列表导入
配置字段信息,结果写入index\FieldInfo.txt。FieldInfo.txt内容
第三步:建立字段信息文件
执行bin\buildTable.bat建立字段信息,结果写入index\Field.dat
第四步:自动建立索引
注:如果不是直接读取数据库建立索引,则略过此步,需要自己调用API编程,自行建立索引。执行bin\buildIndex.bat建立索引
第五步:启动搜索服务
自己建立的索引,也可以启动本服务。执行bin\startServer.bat启动搜索服务;
第六步:启动客户端服务
执行bin\startClient.bat启动客户端服务;