recherche

Maison  >  Questions et réponses  >  le corps du texte

python - 在推荐系统、机器学习中,如何将一个完整的数据集划分为训练集和测试集

如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集

天蓬老师天蓬老师2828 Il y a quelques jours1058

répondre à tous(3)je répondrai

  • 黄舟

    黄舟2017-04-18 09:05:54

    Divisez-le en 10 parties égales et effectuez 10 cycles. À chaque fois, sélectionnez 1 partie comme ensemble de test et 9 parties comme ensemble d'entraînement

    répondre
    0
  • PHP中文网

    PHP中文网2017-04-18 09:05:54

    De manière générale, lors d'une validation croisée, tout le monde définira k sur 5 ou 10. C'est-à-dire que les données sont (aléatoirement) divisées en k parties, dont les parties k-1 sont utilisées pour la formation et la partie 1 sont utilisés pour les tests. Mais ceci dit, vous devez faire une validation croisée, donc cela ne devrait pas être rapide.

    répondre
    0
  • PHP中文网

    PHP中文网2017-04-18 09:05:54

    可以用3.1. Validation croisée : évaluer les performances de l'estimateur

    >>> à partir de sklearn.model_selection importer cross_val_score >>> clf = svm.SVC(noyau='linéaire', C=1) >>> scores = cross_val_score(clf, iris.data, iris.target, cv=5) >>> partitions array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])

    répondre
    0
  • Annulerrépondre