ホームページ > 記事 > テクノロジー周辺機器 > 自己訓練の概念と半教師あり学習との関係
セルフトレーニングは、滑らかさとクラスタリングの仮定を含む半教師あり分類方法です。したがって、自己ラベル付けまたは意思決定指向学習とも呼ばれます。
一般に、ラベル付きデータセットにデータ生成プロセスに関する多くの情報が含まれており、ラベルなしサンプルがアルゴリズムを微調整するためにのみ使用される場合は、セルフ トレーニングが適しています。
しかし、これらの条件が満たされない場合、自己トレーニングの結果は理想的ではありません。したがって、自己トレーニングはラベル付けされたサンプルに大きく依存します。
自己トレーニングの各ステップでは、現在の決定関数に従ってラベルのないデータにラベルを付け、予測を使用して再トレーニングします。
以前に学習した別の教師ありモデルによって予測された擬似ラベルに適合するようにアルゴリズムをセルフトレーニングします。
データ インスタンスはトレーニング セットとテスト セットに分割され、ラベル付けされたトレーニング データに対して分類アルゴリズムがトレーニングされます。データ ポイントを評価し、信頼ベクトルを使用して予測を表します。
2. 最大信頼度に関連付けられた上位 K 個の値を選択し、ラベル付きデータセットに追加します。
3. 分類器は、ラベル付きテスト データ インスタンスのクラス ラベルを予測し、選択されたメトリックを使用して分類器のパフォーマンスを評価します。
4. 分類子は、新しいラベル付きデータセットを使用して再トレーニングされます。
自己学習では、ラベル付きデータセットの構造を利用して、適切な分離超曲面を発見します。このプロセスの後、ラベルのないサンプルが評価され、十分な信頼度で分類されたポイントが新しいトレーニング セットに含まれます。自己トレーニング アルゴリズムは、すべてのデータ ポイントが分類されるまでこのプロセスを繰り返します。
以上が自己訓練の概念と半教師あり学習との関係の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。