Rumah > Soal Jawab > teks badan
如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集
黄舟2017-04-18 09:05:54
Bahagikan ia kepada 10 bahagian yang sama dan kitar 10 kali Setiap kali, pilih 1 bahagian sebagai set ujian dan 9 bahagian sebagai set latihan
PHP中文网2017-04-18 09:05:54
Secara umumnya, apabila melakukan pengesahan silang, semua orang akan menetapkan k kepada 5 atau 10. Maksudnya, data (secara rawak) dibahagikan kepada bahagian k
, yang mana bahagian k-1
digunakan untuk latihan dan bahagian 1
digunakan untuk ujian. Tetapi setelah berkata demikian, anda perlu melakukan pengesahan silang, jadi ia tidak sepatutnya pantas.
PHP中文网2017-04-18 09:05:54
可以用3.1. Pengesahan silang: menilai prestasi penganggar
>>> daripada sklearn.model_selection import cross_val_score
>>> clf = svm.SVC(kernel='linear', C=1)
>>> markah = cross_val_score(clf, iris.data, iris.target, cv=5)
>>> markah
tatasusunan([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])