假如我已经建立了一个文档,是所有需要的标签的集合。一篇文章中出现的我这个文档的标签的集合我都需要将他提取出来作为文章的关键词。
这个应该怎么实现,最好是用php的。
我在网上找了一下中文分词(http-scws),但不知道怎么用?
假如我已经建立了一个文档,是所有需要的标签的集合。一篇文章中出现的我这个文档的标签的集合我都需要将他提取出来作为文章的关键词。
这个应该怎么实现,最好是用php的。
我在网上找了一下中文分词(http-scws),但不知道怎么用?
大概是用中文分词将词语单独分出来然后过滤掉一些,按照频率对词语排序之类的
记得有DZ有这功能可以去看看代码