互联网在近10年的得到飞速发展,互联网正在逐渐深入人们的生活,改变人们的生活。互联网经济也经历了风风雨雨,从缓慢起步到急速膨胀,从泡沫破灭到逐步回暖;从“网络广告”到“拇指经济”,从“网络游戏”到“搜索力经济”。目前,搜索引擎成为最受人们关注的焦点之一。
自然语言的理解是中文智能搜索引擎关键技术。理解的困难主要来自意义和功能两个方面,实际上就是歧义的问题。汉语的语音、语调、轻重音及停顿等,一经书面表达就可能产生歧义;中文词与词之间没有界定,在进行分词时很容易产生歧义;汉语虚词多,组词灵活,字在词中的位置的变化也可能产生歧义。同时,由于搜索引擎所面对的网络信息不仅数量巨大而且是动态的,给知识表达、组织、存取和更新都带来了困难。
自然语言的理解是将信息检索从目前基于关键词层面提高到基于知识(或概念)层面,对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。其技术包括机器翻译技术、语义网络技术、汉语分词技术、短语识别技术、同义词处理技术等。
灵玖软件NLPIR大语义智能分析平台针对大内容采编挖搜的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,先后历时十八年,服务了全球四十万家机构用户,是大时代语义智能分析的一大利器。
JZSearch精准搜索引擎具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持丰富的查询语言和查询类型,支持少数民族语言的搜索。
同时,全文搜索中间件通过可视化界面,可以快速地配置相关参数,启动搜索服务,并提供测试程序,可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。
其主要特性包括:
1. 语义精准搜索:系统不是简单的关键词匹配,会自动根据语义知识进行联想,搜索用户真正需要的信息;并能实现数字、字母的精准搜索,而不是模糊匹配(搜索100,而不会给出1001等不当结果)。
2. 与业务无缝衔接:JZSearch精准搜索引擎能够兼容现有的所有数据库,无需开发,即可实现与现有业务数据库的无缝衔接,实现任意字段的搜索分析,为数据库提供毫秒级的搜索服务;而新增或者修改的数据在10秒内,JZSearch搜索引擎就能捕获并反映在搜索结果中。非常适合企业业务数据的垂直搜索过滤。
3. 更强搜索功能:JZSearch可以便利的搜索各类信息,对搜索结果自动统计分析,还可以实现指定文字范围内的搜索,如:搜索招标公告中的公司名称附件的法人信息,而不是泛泛地搜索,可以实现信息的精准定位。
4. 系统自主维护:JZSearch搜索引擎可以处理TB级别的大数据业务,索引速度10MB/s,搜索响应1秒以内;整个过程无需人工干预,系统部署后,自动索引、自动搜索、自动增量更新、自动优化、自动备份与恢复,实现7*24小时在线运行。
现在是信息化时代,人们越来越依赖互联网,并在互联网上得到了很大的便利与利益。因此,了解互联网目前的发展状况并有效地改善其自身存在的缺陷,对今后方便人们使用有很大的帮助。为此,更好地理解中文网页信息,改进搜索关键词与网页的相关性,提供基于语义联想的搜索推荐词已成为JZSearch精准搜索新一代智能中文搜索引擎系统的核心发现方向。