Maison > Questions et réponses > le corps du texte
如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集
黄舟2017-04-18 09:05:54
Divisez-le en 10 parties égales et effectuez 10 cycles. À chaque fois, sélectionnez 1 partie comme ensemble de test et 9 parties comme ensemble d'entraînement
PHP中文网2017-04-18 09:05:54
De manière générale, lors d'une validation croisée, tout le monde définira k sur 5 ou 10. C'est-à-dire que les données sont (aléatoirement) divisées en k
parties, dont les parties k-1
sont utilisées pour la formation et la partie 1
sont utilisés pour les tests. Mais ceci dit, vous devez faire une validation croisée, donc cela ne devrait pas être rapide.
PHP中文网2017-04-18 09:05:54
可以用3.1. Validation croisée : évaluer les performances de l'estimateur
>>> à partir de sklearn.model_selection importer cross_val_score
>>> clf = svm.SVC(noyau='linéaire', C=1)
>>> scores = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> partitions
array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])