首頁  >  問答  >  主體

python - 文本特征词提取算法

PHP中文网PHP中文网2741 天前653

全部回覆(2)我來回復

  • PHPz

    PHPz2017-04-18 09:27:22

    題主的這個問題,其實是中文處理。 首先說一下,我不是什麼大牛哈,不過倒是做過這方面調查,在這裡給題主分享一下思路吧:
    1 文字處理,需要詞庫,沒有詞庫是無法分詞、詞幹化的,但詞庫這種東西,不是個人、小團體能造出來得
    2 字庫:http://www.afenxi.com/post/9700
    3 有了字庫,你可能還要針對你要處理的業務去“劃一些界限”和“規則”,要讓機器自己知道遇到多個選擇、矛盾的選擇應該如何處理,這就有點兒“機器學習”的意思了
    4 機器學習,怎麼教呢? 得有教科書、題庫,讓機器做,那就是對應的前面的詞庫和N多篇文章
    5 巴拉巴拉說了好幾句,具體工具沒說幾個呵呵~~~
    6 最直接的辦法: 去智聯,搜中文處理職位,看他們的技能要求,基本上就OK了

    回覆
    0
  • 怪我咯

    怪我咯2017-04-18 09:27:22

    效果

    參考地址

    回覆
    0
  • 取消回覆