首頁 > 問答 > 主體
上面的資料是從reuters資料集中取得7303個訓練集,用sklearn對其取tfidf特徵,得到的結果都是0,這是怎麼回事?
#當我從這些資料中取一部分時,對於這些少部分資料能夠得到正確的tfidf結果。
扔个三星炸死你2017-06-28 09:25:35
上程式碼,可能是你精確度太低或是min_count導致的
例如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。