cari

Rumah  >  Soal Jawab  >  teks badan

python - 在推荐系统、机器学习中,如何将一个完整的数据集划分为训练集和测试集

如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集

天蓬老师天蓬老师2828 hari yang lalu1059

membalas semua(3)saya akan balas

  • 黄舟

    黄舟2017-04-18 09:05:54

    Bahagikan ia kepada 10 bahagian yang sama dan kitar 10 kali Setiap kali, pilih 1 bahagian sebagai set ujian dan 9 bahagian sebagai set latihan

    balas
    0
  • PHP中文网

    PHP中文网2017-04-18 09:05:54

    Secara umumnya, apabila melakukan pengesahan silang, semua orang akan menetapkan k kepada 5 atau 10. Maksudnya, data (secara rawak) dibahagikan kepada bahagian k, yang mana bahagian k-1 digunakan untuk latihan dan bahagian 1 digunakan untuk ujian. Tetapi setelah berkata demikian, anda perlu melakukan pengesahan silang, jadi ia tidak sepatutnya pantas.

    balas
    0
  • PHP中文网

    PHP中文网2017-04-18 09:05:54

    可以用3.1. Pengesahan silang: menilai prestasi penganggar

    >>> daripada sklearn.model_selection import cross_val_score
    >>> clf = svm.SVC(kernel='linear', C=1)
    >>> markah = cross_val_score(clf, iris.data, iris.target, cv=5)
    >>> markah                                              
    tatasusunan([ 0.96..., 1. ..., 0.96..., 0.96..., 1. ])

    balas
    0
  • Batalbalas