ホームページ  >  に質問  >  本文

python - 在推荐系统、机器学习中,如何将一个完整的数据集划分为训练集和测试集

如题,有没有快速一点的方法,我如果要做多折交叉验证,应该怎么去划分数据集

天蓬老师天蓬老师2742日前980

全員に返信(3)返信します

  • 黄舟

    黄舟2017-04-18 09:05:54

    平均して 10 の部分に分割し、10 回サイクルし、毎回 1 つの部分をテスト セットとして選択し、9 つの部分をトレーニング セットとして選択します

    返事
    0
  • PHP中文网

    PHP中文网2017-04-18 09:05:54

    一般に、相互検証を行うときは、誰もが k を 5 または 10 に設定します。つまり、データは (ランダムに) k 部分に分割され、そのうち k-1 部分はトレーニングに使用され、1 部分はテストに使用されます。ただし、そうは言っても相互検証を行う必要があるため、高速であるべきではありません。

    返事
    0
  • PHP中文网

    PHP中文网2017-04-18 09:05:54

    3.1 相互検証: 推定器のパフォーマンスの評価を使用できます

    リーリー

    返事
    0
  • キャンセル返事