搜索

首页  >  问答  >  正文

python - 文本特征词提取算法

PHP中文网PHP中文网2811 天前693

全部回复(2)我来回复

  • PHPz

    PHPz2017-04-18 09:27:22

    题主的这个问题,其实是中文处理。 首先说一下,我不是什么大牛哈,不过倒是做过这方面调查,在这里给题主分享一下思路吧:
    1 文字处理,需要词库,没有词库 是无法分词、词干化的,但是词库这种东西,不是个人、小团体能造出来得
    2 词库: http://www.afenxi.com/post/9700
    3 有了词库,你可能还要针对你要处理的业务去“划一些界限”和“规则”,要让机器自己知道遇到多个选择、矛盾的选择 应该如何处理,这就有点儿“机器学习”的意思了
    4 机器学习,怎么教呢? 得有教科书、题库,让机器做,那就是对应的前面的词库和N多篇文章
    5 巴拉巴拉说了好几句,具体工具没说几个呵呵~~~
    6 最直接的办法: 去智联,搜中文处理职位,看他们的技能要求,基本上就OK了

    回复
    0
  • 怪我咯

    怪我咯2017-04-18 09:27:22

    效果

    参考地址

    回复
    0
  • 取消回复