首頁  >  問答  >  主體

python - 用sklearn求大文本的tfidf特徵?


上面的資料是從reuters資料集中取得7303個訓練集,用sklearn對其取tfidf特徵,得到的結果都是0,這是怎麼回事?

#當我從這些資料中取一部分時,對於這些少部分資料能夠得到正確的tfidf結果。

##
大家讲道理大家讲道理2669 天前765

全部回覆(1)我來回復

  • 扔个三星炸死你

    扔个三星炸死你2017-06-28 09:25:35

    上程式碼,可能是你精確度太低或是min_count導致的

    例如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。

    回覆
    0
  • 取消回覆