Heim  >  Artikel  >  php教程  >  PHP搜索引挚支持中文搜索 技术日记

PHP搜索引挚支持中文搜索 技术日记

WBOY
WBOYOriginal
2016-06-06 19:59:221111Durchsuche

环境:window/Linux 工具:PHP mysql apache 注意:本人对在Linux环境下操作生熟,而且没有权限对公网上服务器进行配置,本地环境为window xp.所以要对环境没有需要. 最近一直在查相关PHP搜索引挚有知识,因为想做一个玩玩,不用不知道,一用可是把人愁死了.没想到,

环境:window/Linux

工具:PHP mysql apache

注意:本人对在Linux环境下操作生熟,而且没有权限对公网上服务器进行配置,本地环境为window xp.所以要对环境没有需要.

 

      最近一直在查相关PHP搜索引挚有知识,因为想做一个玩玩,不用不知道,一用可是把人愁死了.没想到,现在网上对针对中文搜索功能如此馈乏.头疼啊.

     

      记录一:前面已经说过,由于环境的原因.所以现在最流行的搜索工具sphinx,lucene都不能使用了.我哭.........

 

      记录二:risearch php

花了几天的时间终于把配置文件读明白,可以还是白费功夫,因为不支持中文检索。从网上也找不到方法使它支持.

 

      记录三:phpdig

不支持中文分词,我从网上查不到如可才能让它中文检索,否则是个不错的选择。

 

      记录四:sphider 它支持中文搜索,但是用不好会有编问题,昨天晚上我调到晚上12半了都没调好,而且对中文的分词的效果不是很好,只能说可以用。但还是不用为好.

 


试验了这么多都不可以,头痛啊,本来想从网上直接找一个省事,没想到中文搜索的支持效果这么差,只能是自己写了,省事省不了了。哞

 

不能直接使用网上开源搜索引挚的原因是不能进行中文匹配,也就是说不能进行中文分词,哪就只能从网上找个中文分词工具了。从网上查找到PHPCWS ,天呢,“HTTPCWS 是一款基于HTTP协议的开源中文分词系统,目前仅支持Linux系统”,还是不能用。

 

不过天无绝人之路,最终还是让我找到了一个分词工具HJ_SegWord(PHP无组件分词),是个人写的,还好用,分词技术的问题解决了,下一个问题就要解决算法的问题了。明天再说了,我的头快痛死了。

 

 

 

 

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn