ホームページ >テクノロジー周辺機器 >AI >相互検証の概念と一般的な相互検証方法を紹介します。

相互検証の概念と一般的な相互検証方法を紹介します。

王林
王林転載
2024-01-23 18:15:211615ブラウズ

交叉验证的概念 常见交叉验证的方法介绍

相互検証は、機械学習モデルのパフォーマンスを評価するために一般的に使用される方法です。データセットを重複しない複数のサブセットに分割し、その一部はトレーニング セットとして機能し、残りはテスト セットとして機能します。複数のモデルのトレーニングとテストを通じて、モデルの平均パフォーマンスが汎化パフォーマンスの推定値として取得されます。相互検証により、モデルの一般化能力をより正確に評価し、過剰適合または過小適合の問題を回避できます。

# 一般的に使用される相互検証方法には次のようなものがあります:

1. 単純な相互検証

通常、データ セットをトレーニング セットとテスト セットに分割します。トレーニング セットはデータ全体の 70% ~ 80% を占め、残りのデータはテスト セットとして使用されます。トレーニング セットを使用してモデルをトレーニングし、次にテスト セットを使用してモデルのパフォーマンスを評価します。このアプローチの欠点の 1 つは、データ セットの分割方法に非常に敏感であることです。トレーニング セットとテスト セットの分割が不適切な場合、モデルのパフォーマンスが不正確に評価される可能性があります。したがって、正確なモデル評価結果を得るには、適切なセグメンテーション方法を選択することが非常に重要です。

2.K 分割相互検証

データセットを K 部分に分割し、毎回 1 つの部分をテスト セットとして使用し、残りの K-1 パーツはトレーニング セットとして使用され、モデルがトレーニングされてテストされます。毎回異なる部品をテストセットとして使用して K 回繰り返し、最終的に K 個の評価結果を平均してモデルの性能評価結果を取得します。このアプローチの利点は、データセットの分割方法に影響されないため、モデルのパフォーマンスをより正確に評価できることです。

3. ブートストラッピング法の相互検証

#このメソッドは、まず、トレーニング セットとして置換されたデータ セットから n 個のサンプルをランダムに選択します。以下のサンプルは、モデルのトレーニングとテストのためのテスト セットとして使用されます。次に、テスト セットをデータ セットに戻し、n 個のサンプルをトレーニング セットとしてランダムに選択し、残りのサンプルをテスト セットとして、K 回繰り返します。最後に、K 個の評価結果を平均して、モデルの性能評価結果を取得します。ブートストラップ相互検証の利点は、データセット内のすべてのサンプルを最大限に利用できることですが、欠点は、サンプルを再利用するため、評価結果のばらつきが大きくなる可能性があることです。

4. 1 つ抜きの相互検証

このメソッドでは、各サンプルをテスト セットとして使用してモデルをトレーニングおよびテストします。そしてK回繰り返します。最後に、K 個の評価結果を平均して、モデルの性能評価結果を取得します。 Leave-one-out 相互検証の利点は、小規模なデータセットの評価がより正確であることですが、欠点は、大量のモデルのトレーニングとテストが必要で、計算コストが高いことです。

5. 階層化された相互検証

この方法は、K 分割相互検証に基づいており、カテゴリに従ってデータセットを階層化します。トレーニング セットとテスト セット内の各カテゴリの割合が同じであることを確認します。この方法は、クラス間のサンプル数が不均衡である多分類問題に適しています。

6. 時系列相互検証

このメソッドは、トレーニング セットを分割する時系列データの相互検証メソッドです。時系列順とテスト セットを使用して、モデルのトレーニングに将来のデータを使用しないようにします。時系列相互検証では通常、スライディング ウィンドウ法が使用されます。つまり、トレーニング セットとテスト セットを特定のタイム ステップずつ前方にスライドさせ、モデルのトレーニングとテストを繰り返します。

7. 反復された相互検証

このメソッドは、K 分割相互検証に基づいており、相互検証を複数回繰り返します。異なるランダムシードまたは異なるデータセット分割方法を使用して、モデルのパフォーマンス評価結果は、複数の評価結果を平均することによって最終的に取得されます。相互検証を繰り返すことで、モデルのパフォーマンス評価結果のばらつきを減らし、評価の信頼性を向上させることができます。

つまり、相互検証手法は機械学習の分野において非常に重要なモデル評価手法であり、モデルのパフォーマンスをより正確に評価し、過剰適合や過小適合を回避するのに役立ちます。統合の。異なる相互検証方法は異なるシナリオやデータセットに適しており、特定の状況に応じて適切な相互検証方法を選択する必要があります。

以上が相互検証の概念と一般的な相互検証方法を紹介します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は163.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。