Heim > Fragen und Antworten > Hauptteil
如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集
PHP中文网2017-04-18 09:05:54
一般来讲,做cross validation的时候,大家会把k设为5或者10。也就是说,将数据(随机)分为k
份,其中k-1
份为训练,1
份做测试。不过话说回来,都要做cross validation了,应该是快不了的。
PHP中文网2017-04-18 09:05:54
可以用3.1. Cross-validation: evaluating estimator performance
>>> from sklearn.model_selection import cross_val_score
>>> clf = svm.SVC(kernel='linear', C=1)
>>> scores = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> scores
array([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])