Maison  >  Questions et réponses  >  le corps du texte

python - Utiliser Sklearn pour trouver les fonctionnalités Tfidf d'un texte volumineux?


Les données ci-dessus sont obtenues à partir de l'ensemble de formation 7303 de l'ensemble de données Reuters, et sklearn est utilisé pour prendre la fonctionnalité tfidf. Les résultats obtenus sont tous 0. Que se passe-t-il ?

Lorsque je prends une partie de ces données, je peux obtenir les résultats tfidf corrects pour ces petites parties des données.

大家讲道理大家讲道理2669 Il y a quelques jours764

répondre à tous(1)je répondrai

  • 扔个三星炸死你

    扔个三星炸死你2017-06-28 09:25:35

    Le code ci-dessus peut être dû à une précision trop faible ou à min_count

    Par exemple, si la fréquence des mots est de 1 et que le nombre total de mots est de 1e9, le tf correspondant est de 1e-9, qui est ignoré.

    répondre
    0
  • Annulerrépondre