Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Das Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen

Das Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen

WBOY
WBOYnach vorne
2024-01-23 17:15:05607Durchsuche

Das Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen

Selbsttraining ist eine halbüberwachte Klassifizierungsmethode, die Glätte- und Clustering-Annahmen umfasst. Daher wird es auch Selbstkennzeichnung oder entscheidungsorientiertes Lernen genannt.

Im Allgemeinen ist Selbsttraining eine gute Wahl, wenn der beschriftete Datensatz viele Informationen über den Datengenerierungsprozess enthält und die unbeschrifteten Proben nur zur Feinabstimmung des Algorithmus verwendet werden.

Wenn diese Bedingungen jedoch nicht erfüllt sind, sind die Ergebnisse des Selbsttrainings nicht ideal. Daher hängt das Selbsttraining stark von gekennzeichneten Proben ab.

Jeder Schritt des Selbsttrainings kennzeichnet unbeschriftete Daten gemäß der aktuellen Entscheidungsfunktion und trainiert sie mithilfe von Vorhersagen neu.

Wie Selbsttraining funktioniert

Trainieren Sie selbst einen Algorithmus, um Pseudo-Labels anzupassen, die von einem anderen zuvor erlernten überwachten Modell vorhergesagt wurden.

Selbsttraining hat diese Schlüsselpunkte

Dateninstanzen werden in Trainingssätze und Testsätze unterteilt, und der Klassifizierungsalgorithmus wird anhand der gekennzeichneten Trainingsdaten trainiert. Werten Sie Datenpunkte aus und verwenden Sie Konfidenzvektoren, um Vorhersagen darzustellen.

2. Wählen Sie die höchsten K-Werte aus, die mit der maximalen Konfidenz verbunden sind, und fügen Sie sie dem beschrifteten Datensatz hinzu.

3. Der Klassifikator sagt die Klassenbezeichnung der gekennzeichneten Testdateninstanz voraus und bewertet die Klassifikatorleistung anhand der ausgewählten Metrik.

4. Der Klassifikator wird mithilfe des neuen gekennzeichneten Datensatzes neu trainiert.

Selbsttraining nutzt die Struktur gekennzeichneter Datensätze, um geeignete Trennungshyperflächen zu entdecken. Nach diesem Vorgang werden unbeschriftete Stichproben ausgewertet und klassifizierte Punkte mit ausreichender Sicherheit in den neuen Trainingssatz aufgenommen. Der Selbsttrainingsalgorithmus wiederholt diesen Vorgang, bis jeder Datenpunkt klassifiziert ist.

Das obige ist der detaillierte Inhalt vonDas Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:163.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen