Heim >Technologie-Peripheriegeräte >KI >Sprechen wir über Bilderkennung: Recurrent Neural Network

Sprechen wir über Bilderkennung: Recurrent Neural Network

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBnach vorne: 2023-04-08 15:11:031703Durchsuche

Dieser Artikel stammt aus dem öffentlichen WeChat-Konto „Leben im Informationszeitalter“. Der Autor lebt im Informationszeitalter. Um diesen Artikel erneut zu drucken, wenden Sie sich bitte an das öffentliche Konto „Living in the Information Age“.

Recurrent Neural Network (RNN) wird hauptsächlich zur Lösung von Sequenzdatenproblemen verwendet. Der Grund dafür, dass es sich um ein rekurrentes neuronales Netzwerk handelt, liegt darin, dass die aktuelle Ausgabe einer Sequenz auch mit der vorherigen Ausgabe zusammenhängt. Das RNN-Netzwerk merkt sich Informationen aus früheren Momenten und wendet sie auf die aktuelle Ausgabeberechnung an. Im Gegensatz zum Faltungs-Neuronalen Netzwerk sind die Neuronen in den verborgenen Schichten des wiederkehrenden Neuronalen Netzwerks miteinander verbunden bestimmt durch die Eingabe. Die Ausgabe der Schicht setzt sich aus der Ausgabe der verborgenen Neuronen im vorherigen Moment zusammen. Obwohl das RNN-Netzwerk einige bemerkenswerte Ergebnisse erzielt hat, weist es einige Mängel und Einschränkungen auf, wie z. B. Schwierigkeiten beim Training, geringe Genauigkeit, geringe Effizienz, lange Zeit usw. Daher wurden nach und nach einige verbesserte Netzwerkmodelle auf Basis von RNN entwickelt, z als: Long Short-Term Memory (LSTM), bidirektionales RNN, bidirektionales LSTM, GRU usw. Diese verbesserten RNN-Modelle haben hervorragende Ergebnisse im Bereich der Bilderkennung gezeigt und sind weit verbreitet. Am Beispiel des LSTM-Netzwerks stellen wir seine Hauptnetzwerkstruktur vor.

Long Short-Term Memory (LSTM) löst die Probleme des Gradientenverschwindens oder der Gradientenexplosion in RNN und kann Langzeitabhängigkeitsprobleme lernen. Seine Struktur ist wie folgt.