Wiederkehrende Neuronale Netze (RNN) - Arbeiten und Schritte von RNN

Einführung in wiederkehrende neuronale Netze (RNN)

Ein wiederkehrendes neuronales Netzwerk ist ein Typ eines künstlichen neuronalen Netzwerks (Artificial Neural Network, ANN) und wird in Anwendungsbereichen der Verarbeitung natürlicher Sprache (NLP) und der Spracherkennung verwendet. Ein RNN-Modell soll die sequentiellen Eigenschaften von Daten erkennen und anschließend anhand der Muster das kommende Szenario vorhersagen.

Arbeiten von wiederkehrenden neuronalen Netzen

Wenn wir über traditionelle neuronale Netze sprechen, sind alle Ausgänge und Eingänge unabhängig voneinander, wie in der folgenden Abbildung dargestellt:

Im Fall von wiederkehrenden neuronalen Netzen wird die Ausgabe der vorherigen Schritte in die Eingabe des aktuellen Zustands eingespeist. Um beispielsweise den nächsten Buchstaben eines Wortes oder das nächste Wort des Satzes vorherzusagen, müssen die vorherigen Buchstaben oder Wörter gespeichert und in irgendeiner Form gespeichert werden.

Die verborgene Schicht ist diejenige, die sich einige Informationen über die Sequenz merkt. Ein einfaches Beispiel aus dem wirklichen Leben, mit dem wir RNN in Beziehung setzen können, ist, wenn wir einen Film ansehen. In vielen Fällen können wir vorhersagen, was als nächstes passieren wird, aber was ist, wenn jemand gerade dem Film beigetreten ist und er gefragt wird, was vorherzusagen wird als nächstes passieren? Was wird seine Antwort sein? Er oder sie wird keine Ahnung haben, weil sie die vorherigen Ereignisse des Films nicht kennen und keine Erinnerung daran haben.

Eine Abbildung eines typischen RNN-Modells ist unten angegeben:

Die RNN-Modelle verfügen über einen Speicher, der sich immer daran erinnert, was in den vorherigen Schritten getan und was berechnet wurde. Für alle Eingänge wird dieselbe Aufgabe ausgeführt, und RNN verwendet für jeden Eingang denselben Parameter. Da das traditionelle neuronale Netz unabhängige Ein- und Ausgangssätze hat, sind sie komplexer als RNN.

Versuchen wir nun, das wiederkehrende neuronale Netz anhand eines Beispiels zu verstehen.

Angenommen, wir haben ein neuronales Netzwerk mit 1 Eingabeebene, 3 ausgeblendeten Ebenen und 1 Ausgabeebene.

Wenn wir über andere oder die traditionellen neuronalen Netze sprechen, haben sie ihre eigenen Sätze von Vorspannungen und Gewichten in ihren verborgenen Schichten wie (w1, b1) für die verborgene Schicht 1, (w2, b2) für die verborgene Schicht 2 und (w3, b3 ) für die dritte verborgene Schicht, wobei: w1, w2 und w3 die Gewichte sind und b1, b2 und b3 die Vorspannungen sind.

In Anbetracht dessen können wir sagen, dass jede Ebene von keiner anderen abhängig ist und dass sie sich an nichts über die vorherige Eingabe erinnern kann:

Nun wird ein RNN Folgendes tun:

Die unabhängigen Ebenen werden in die abhängige Ebene konvertiert. Dies wird erreicht, indem allen Schichten die gleichen Vorspannungen und Gewichte zur Verfügung gestellt werden. Dies reduziert auch die Anzahl von Parametern und Schichten in dem wiederkehrenden neuronalen Netzwerk und hilft RNN, die vorherige Ausgabe zu speichern, indem die vorherige Ausgabe als Eingabe für die kommende verborgene Schicht ausgegeben wird.
Zusammenfassend kann gesagt werden, dass alle ausgeblendeten Ebenen zu einer einzigen wiederkehrenden Ebene zusammengefasst werden können, sodass die Gewichte und die Vorspannung für alle ausgeblendeten Ebenen gleich sind.
Ein wiederkehrendes neuronales Netzwerk sieht also wie folgt aus:

Nun ist es Zeit, sich mit einigen Gleichungen für ein RNN-Modell zu befassen.

Zur Berechnung des aktuellen Zustands

h _t= f (h _t-1, x _t ),

Wo:

x _t ist der Eingangszustand
h _t-1 ist der vorherige Zustand,
h _t ist der aktuelle Zustand.

Zur Berechnung der Aktivierungsfunktion

h _t= tanh (W _hh h _t-1 +W _xh x _t ),

Wo:
W _xh ist das Gewicht am Eingangsneuron,

W _hh ist das Gewicht eines wiederkehrenden Neurons.

Zur Berechnung der Leistung:

Y _t =W _hy h _t.

Wo,
Y _t ist die Ausgabe und,
W _hy ist das Gewicht an der Ausgabeschicht.

Schritte zum Trainieren eines wiederkehrenden neuronalen Netzwerks

In den Eingabeebenen wird die anfängliche Eingabe gesendet, wobei alle das gleiche Gewicht und die gleiche Aktivierungsfunktion haben.
Unter Verwendung des aktuellen Eingangs und des vorherigen Statusausgangs wird der aktuelle Status berechnet.
Jetzt wird der aktuelle Zustand h _t zum zweiten Mal zu h _t-1 .
Dies wiederholt sich für alle Schritte und um ein bestimmtes Problem zu lösen, kann es so oft fortgesetzt werden, bis die Informationen aus allen vorherigen Schritten zusammengefügt sind.
Der letzte Schritt wird dann anhand des aktuellen Zustands des letzten Zustands und aller anderen vorherigen Schritte berechnet.
Jetzt wird ein Fehler generiert, indem die Differenz zwischen der tatsächlichen Ausgabe und der von unserem RNN-Modell generierten Ausgabe berechnet wird.
Der letzte Schritt ist der Backpropagation-Vorgang, bei dem der Fehler zurückpropagiert wird, um die Gewichte zu aktualisieren.

Vorteile wiederkehrender neuronaler Netze

RNN kann Eingaben beliebiger Länge verarbeiten.
Ein RNN-Modell wird so modelliert, dass alle Informationen während der gesamten Zeit gespeichert werden. Dies ist in jedem Zeitreihen-Prädiktor sehr hilfreich.
Auch wenn die Eingabegröße größer ist, nimmt die Modellgröße nicht zu.
Die Gewichte können über die Zeitschritte verteilt werden.
RNN kann ihren internen Speicher zum Verarbeiten der willkürlichen Reihe von Eingaben verwenden, was bei vorwärtsgerichteten neuronalen Netzen nicht der Fall ist.

Nachteile wiederkehrender neuronaler Netze

Aufgrund ihrer wiederkehrenden Natur ist die Berechnung langsam.
Das Training von RNN-Modellen kann schwierig sein.
Wenn wir relu oder tanh als Aktivierungsfunktionen verwenden, wird es sehr schwierig, Sequenzen zu verarbeiten, die sehr lang sind.
Anfällig für Probleme wie Explodieren und Verschwinden des Gefälles.

Fazit

In diesem Artikel haben wir einen anderen Typ eines künstlichen neuronalen Netzwerks mit dem Namen "Recurrent Neural Network" kennengelernt. Wir haben uns auf den Hauptunterschied konzentriert, der RNN von anderen Typen neuronaler Netzwerke unterscheidet und NLP (Natural Language Processing). Darüber hinaus haben wir uns mit der Arbeit an RNN-Modellen und -Funktionen beschäftigt, mit denen ein robustes RNN-Modell erstellt wird.

Empfohlene Artikel

Dies ist eine Anleitung für wiederkehrende neuronale Netze. Hier diskutieren wir die Einführung, wie es funktioniert, Schritte, Vor- und Nachteile von RNN usw. Sie können auch unsere anderen vorgeschlagenen Artikel durchgehen, um mehr zu erfahren -

Was sind neuronale Netze?
Frameworks für maschinelles Lernen
Einführung in die künstliche Intelligenz
Einführung in Big Data Analytics
Implementierung neuronaler Netze

Wiederkehrende Neuronale Netze (RNN) - Arbeiten und Schritte von RNN

Inhaltsverzeichnis:

Einführung in wiederkehrende neuronale Netze (RNN)

Arbeiten von wiederkehrenden neuronalen Netzen

Schritte zum Trainieren eines wiederkehrenden neuronalen Netzwerks

Vorteile wiederkehrender neuronaler Netze

Nachteile wiederkehrender neuronaler Netze

Fazit

Empfohlene Artikel

Bevorzugte Dividendenformel - Rechner (Excel-Vorlage)

Power View in Excel - Interaktive Berichte und Dashboards mit Power View

Predictive Analytics vs Statistics - 6 nützliche Vergleiche zu lernen

Vorhersagemodellierung - Arten von prädiktiven Modellierungsmethoden

7 Tipps, die Sie dazu befähigen, sich selbst mit Zuversicht zu präsentieren

Projektplan vs Projektmanagementplan - Kennen Sie die wichtigsten Unterschiede

Projektplanungstechniken - Verschiedene Techniken der Projektplanung

Projektplanung Bau - Vollständiger Leitfaden zur Projektplanung

Projektplanung und -terminierung - Unterschiedliche Vorteile und Stufen

6 Grundlegende Schritte zur Entwicklung eines Projektrisikomanagementplans

Umfassende Technik zum Erstellen einer mobilen App mit Phonegap

5 effektivste Möglichkeiten, um in Ihrer Karriere proaktiv zu sein

Die wichtigsten Dinge, um den besten Karriereweg zu wählen (wertvoll)

Wie mische ich Bilder in Photoshop? - Erstellen Sie erstaunliche und realistische Bilder

10 nützliche Schritte zum Erstellen eines interaktiven Excel-Dashboards (einfach)