Home > Article > Backend Development > Zend_Search_Lucene 中文搜索问题
Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。
例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?
请大家给点建议我,无论是不是最终答案。
Joomla Jifile组件使用了Zend_Search_Lucene来搜索内容,虽然也能搜索到中文,不过搜索结果有点问题。
例如我搜索“日内瓦协议”可以搜索到内容,但我搜索“日内瓦”或者“协议”就无法搜索得到。内容并不多,我不需要实现中文分词,只需要匹配到文字就行了。能否把Zend_Search_Lucene改为关键字直接匹配呢?
请大家给点建议我,无论是不是最终答案。
Lucene默认不支持中文分词,你又想按照“日内瓦”或者“协议”的方式搜索,那是没办法的,全文搜索的索引方式就是这样。
针对Zend_Search_Lucene,网上有人已经实现了简单中文分词了,如果你对分词语义精度要求不高就可以直接用了。自己google下“Zend_Search_Lucene CN_Lucene_Analyzer”