比如搜索jb51.net会把www.jb51.net、jb51.net、sc.jb51.net等都搜索出来
搜索子域名
比如搜索jb51.net会把www.jb51.net、jb51.net、host.jb51.net等都搜索出来。
如果使用mysql用like的话效率是非常低的,几百万甚至上千万的数据那是没有办法使用的,于是采取sphinx来做。
在使用的过程中发现了诸多问题,这里将其总结起来,也让不知道的朋友注意下这些字符。
分析:
sphinx是全文索引,它搜索的是包含的记录。
首先如果我们不做任何设置的话,搜索jb51.net会出现把aajb51.net、jb51.a.cn、jb51.net.com(当然这个域名后缀不存在,但是会有符合相应规则的域名,这里只举例)等等。
为什么会出现这种情况呢?
我们使用./search -c 配置文件 -i 索引名 'jb51.net' 搜索的时候会发现下面words部分被分成了两部分'jb51'和'cn',默认以.作为分隔符,如果我们不想让它做为分隔符,就需要把.添加到charset_table里面,这里需要说的是我们搜索域名只需要有字母、数字、"-"等字符,其他的不需要。设置如下:
charset_table = 0..9,A..Z->a..z, a..z,U+002e,U+002d,U+0040,U+0060 #其中U+002e代表".",U+002d代表"-",U+0040代表"@",U+0060代表"`",这里为ascii码值。
这样会解决掉搜出jb51.a.cn这类域名。
那么jb51.net.com这类呢?我们可以在索引的字段中增加惟一后缀比如“XXXXX”,concat(search,'XXXXX')这样,就不会出来了。
现在就剩下aajb51.net这类域名,我们使用关键字“ '".jb51.net"' ”(注意是单引号里面套双引号)这样来搜索,主域名单独加上,但是使用的过程中发现这样搜出了与这个域名无关的域名,比如aa.bb.cn这样,经后来研究是"."的问题,后来把"."替换成"@",来搜索又出现12306等好多域名无法读取到的问题,后来经研究估计这些特殊字符在sphinx中都有特殊的意义,于是找到了"`"这个字符,换成这个以后一切才算正常了。
注意:将"."替换成"`"等相应字符后需在charset_table里增加这个字符,不然是被忽略的。
所以在搜索的过程中我们需要注意下这些特殊字符。

如何使用PHP扩展Sphinx进行全文搜索全文搜索是现代Web应用程序中的常见需求之一。为了满足用户对数据的高效查询和检索,我们可以使用Sphinx这个功能强大的开源搜索引擎来实现全文搜索功能。Sphinx使用C++编写,提供了PHP的扩展,方便我们在PHP项目中使用。本文将介绍如何使用PHP扩展Sphinx进行全文搜索

Sphinx实现全文搜索的PHP应用指南引言:在现代的Web应用中,全文搜索功能已经成为了一个必备的特性。因为用户常常会通过输入关键词来搜索和匹配他们所需要的内容。为了提供高效和准确的搜索结果,我们需要一个强大的搜索引擎。而Sphinx作为一个开源的全文搜索引擎,它为PHP提供了一个完美的搜索解决方案。本文将介绍如何使用Sphinx实现

SphinxPHP在自然语言处理中的应用技巧,需要具体代码示例随着互联网的发展和人工智能技术的进步,自然语言处理(NaturalLanguageProcessing,NLP)成为了计算机科学中一个重要的研究方向。自然语言处理的目标是让计算机能够理解、解释和生成自然语言,使得人与机器之间的交流更加便捷和智能化。在自然语言处理中,文本检索是一个非常重要

Sphinx是一个开源的全文搜索引擎,可以快速、高效地实现大规模数据的搜索和检索。在PHP项目中,使用Sphinx可以实现实时搜索效果,提升用户体验和搜索速度。本文将介绍如何在PHP项目中使用Sphinx,并提供具体的代码示例。一、安装Sphinx要在PHP项目中实现实时搜索效果,首先需要安装Sphinx。可以在Sphinx的官方

Sphinx分布式搜索的PHP实现方法解析引言:在当今互联网时代,搜索引擎已经成为人们获取信息的主要方式之一。为了提供更高效、更准确的搜索结果,一些大规模的网站或应用程序通常会使用分布式搜索引擎来处理搜索请求。Sphinx是一种知名的分布式搜索引擎,具有良好的性能和扩展性。本文将介绍如何使用PHP实现Sphinx分布式搜索,并提供具体的代码示

Sphinx是一款开源的全文搜索引擎,它能够快速地处理大量的数据并提供高效的搜索功能。在PHP项目中使用Sphinx,可以实现快速的搜索和缓存优化,提升项目的性能和用户体验。本文将介绍如何在PHP项目中集成Sphinx,并通过具体的代码示例来说明其使用方法和优势。一、Sphinx的安装与配置要使用Sphinx,首先需要在服务器上进行安装并进

SphinxPHP在电商网站中的商品搜索与排序优化在电商网站中,商品的搜索与排序是用户体验和销售转化的重要因素之一。为了提高用户的搜索体验和呈现与用户需求最匹配的结果,SphinxPHP是一款非常强大且广泛应用的全文搜索引擎。本文将介绍如何利用SphinxPHP在电商网站中进行商品搜索与排序优化,并提供具体的代码示例。一、安装和配置Sphin

Sphinx进行PHP语言搜索优化的实践方法,需要具体代码示例摘要:Sphinx是一个功能强大的开源搜索引擎工具,可用于在Web应用程序中实现高效的搜索功能。本文将介绍如何使用Sphinx进行PHP语言搜索优化,并提供详细的代码示例。导语:随着互联网的快速发展,用户对搜索功能的需求也不断增加。针对大规模数据的高效搜索以及搜索结果的准确性,


Hot AI Tools

Undresser.AI Undress
AI-powered app for creating realistic nude photos

AI Clothes Remover
Online AI tool for removing clothes from photos.

Undress AI Tool
Undress images for free

Clothoff.io
AI clothes remover

AI Hentai Generator
Generate AI Hentai for free.

Hot Article

Hot Tools

SublimeText3 Chinese version
Chinese version, very easy to use

Dreamweaver Mac version
Visual web development tools

WebStorm Mac version
Useful JavaScript development tools

Notepad++7.3.1
Easy-to-use and free code editor

SecLists
SecLists is the ultimate security tester's companion. It is a collection of various types of lists that are frequently used during security assessments, all in one place. SecLists helps make security testing more efficient and productive by conveniently providing all the lists a security tester might need. List types include usernames, passwords, URLs, fuzzing payloads, sensitive data patterns, web shells, and more. The tester can simply pull this repository onto a new test machine and he will have access to every type of list he needs.
