Einführung in das Reinforcement Learning
Reinforcement Learning ist eine Form des maschinellen Lernens und daher auch ein Teil der künstlichen Intelligenz. Wenn es auf Systeme angewendet wird, führt das System Schritte aus und lernt basierend auf den Ergebnissen der Schritte, um ein komplexes Ziel zu erreichen, das vom System erreicht werden soll.
Reinforcement Learning verstehen
Versuchen wir, mit Hilfe von zwei einfachen Anwendungsfällen das Lernen zu vertiefen:
Fall 1
Da ist ein Baby in der Familie und sie hat gerade angefangen zu laufen und alle sind sehr glücklich darüber. Eines Tages versuchen die Eltern, ein Ziel zu setzen, lassen uns Baby die Couch erreichen und sehen, ob das Baby dazu in der Lage ist.
Ergebnis von Fall 1: Das Baby erreicht das Sofa erfolgreich und somit ist jeder in der Familie sehr froh, dies zu sehen. Der gewählte Weg wird nun mit einer positiven Belohnung belohnt.
Punkte: Belohnung + (+ n) → Positive Belohnung.
Quelle: https://images.app.goo.gl/pGCXJ1N1bzLAer126
Fall # 2
Das Baby konnte die Couch nicht erreichen und ist gefallen. Es tut weh! Was könnte der Grund sein? Auf dem Weg zur Couch könnten sich einige Hindernisse befinden, und das Baby war auf Hindernisse gestürzt.
Ergebnis von Fall 2: Das Baby fällt auf einige Hindernisse und weint! Oh, das war schlimm, lernte sie, das nächste Mal nicht in die Falle eines Hindernisses zu geraten. Der gewählte Pfad wird jetzt mit einer negativen Belohnung belohnt.
Punkte: Belohnungen + (-n) → Negative Belohnung.
Quelle: https://images.app.goo.gl/FRfd8cUqrQRLe6sZ7
Jetzt haben wir die Fälle 1 und 2 gesehen, in denen das verstärkte Lernen im Konzept dasselbe tut, mit der Ausnahme, dass es nicht menschlich ist, sondern rechnerisch ausgeführt wird.
Bewehrung schrittweise einsetzen
Lassen Sie uns das Lernen der Verstärkung verstehen, indem Sie schrittweise einen Verstärkungsagenten einführen. In diesem Beispiel ist Mario unser Agent für das Erlernen von Verstärkung. Er lernt, wie man alleine spielt:
Quelle: https://images.app.goo.gl/Kj44uvBzWzMw1QzE9
- Der aktuelle Status der Mario-Spielumgebung ist S_0. Denn das Spiel hat noch nicht begonnen und der Mario ist an seinem Platz.
- Als nächstes wird das Spiel gestartet und der Mario bewegt sich, der Mario, dh RL Agent, ergreift und handelt, sagen wir A_0.
- Jetzt ist der Status der Spielumgebung S_1.
- Außerdem wird dem RL-Agenten, dh dem Mario, jetzt ein positiver Belohnungspunkt, R_1, zugewiesen, wahrscheinlich, weil der Mario noch lebt und keine Gefahr aufgetreten ist.
Jetzt läuft die obige Schleife weiter, bis der Mario endgültig tot ist oder das Ziel erreicht ist. Dieses Modell gibt kontinuierlich die Aktion, die Belohnung und den Status aus.
Maximierungsbelohnungen
Das Ziel des verstärkten Lernens besteht darin, die Belohnungen zu maximieren, indem bestimmte andere Faktoren wie der Belohnungsrabatt berücksichtigt werden. Was unter Rabatt zu verstehen ist, werden wir in Kürze anhand einer Illustration erläutern.
Die kumulative Formel für vergünstigte Prämien lautet wie folgt:
Rabatt-Belohnungen
Lassen Sie uns dies anhand eines Beispiels verstehen:
- In der gegebenen Figur ist das Ziel, dass die Maus im Spiel so viel Käse essen muss, bevor sie von einer Katze gefressen wird oder ohne Elektroschock.
- Nun können wir davon ausgehen, dass je näher wir der Katze oder der elektrischen Falle sind, desto wahrscheinlicher ist es, dass die Maus gefressen oder geschockt wird.
- Dies impliziert, dass es besser ist, den Käse in der Nähe zu essen, um jedes Risiko zu vermeiden, auch wenn wir den vollen Käse in der Nähe des Elektroschockblocks oder in der Nähe der Katze haben, je riskanter es ist, dorthin zu gehen.
- Wir haben also einen „Block1“ mit Käse, der voll ist und weit von der Katze und dem Elektroschockblock entfernt ist, und den anderen „Block2“, der ebenfalls voll ist, sich aber entweder in der Nähe der Katze oder des Elektroschockblocks befindet, der spätere Käseblock, dh "Block2", wird in Belohnungen mehr abgezinst als der vorherige.
Quelle: https://images.app.goo.gl/8QrH78FjmRVs5Wxk8
Quelle: https://cdn-images-1.medium.com/max/800/1*l8wl4hZvZAiLU56hT9vLlg.png.webp
Arten des Verstärkungslernens
Nachfolgend sind die beiden Arten des Bestärkungslernens mit ihren Vor- und Nachteilen aufgeführt:
1. positiv
Wenn Stärke und Häufigkeit des Verhaltens aufgrund des Auftretens eines bestimmten Verhaltens zunehmen, spricht man von positivem Bestärkungslernen.
Vorteile: Die Leistung wird maximiert und die Veränderung bleibt länger bestehen.
Nachteile: Die Ergebnisse können sich verschlechtern, wenn wir zu viel Verstärkung haben.
2. Negativ
Es ist die Stärkung des Verhaltens, vor allem weil der negative Begriff verschwindet.
Vorteile: Das Verhalten ist erhöht.
Nachteile: Mit Hilfe des negativen Bestärkungslernens kann nur das minimale Verhalten des Modells erreicht werden.
Wo sollte Reinforcement Learning eingesetzt werden?
Dinge, die mit Reinforcement Learning / Beispielen gemacht werden können. Im Folgenden sind die Bereiche aufgeführt, in denen derzeit verstärktes Lernen eingesetzt wird:
- Gesundheitswesen
- Bildung
- Spiele
- Computer Vision
- Geschäftsführung
- Robotik
- Finanzen
- NLP (Natural Language Processing)
- Transport
- Energie
Karrieren im Reinforcement Learning
Es gibt tatsächlich einen Bericht von der Baustelle, da RL ein Zweig des maschinellen Lernens ist, laut Bericht ist maschinelles Lernen der beste Job des Jahres 2019. Unten ist die Momentaufnahme des Berichts. Nach den aktuellen Trends kommt ein Machine Learning Engineers mit einem satten Durchschnittsgehalt von 146.085 US-Dollar und einer Wachstumsrate von 344 Prozent.
Quelle: https://i0.wp.com/www.artificialintelligence-news.com/wp-content/uploads/2019/03/indeed-top-jobs-2019-best.jpg.webp?w=654&ssl=1
Fähigkeiten für das Reinforcement Learning
Nachfolgend sind die Fähigkeiten aufgeführt, die zum Erlernen der Verstärkung erforderlich sind:
1. Grundfertigkeiten
- Wahrscheinlichkeit
- Statistiken
- Datenmodellierung
2. Programmierkenntnisse
- Grundlagen der Programmierung und Informatik
- Design von Software
- Kann Bibliotheken und Algorithmen für maschinelles Lernen anwenden
3. Maschinelles Lernen von Programmiersprachen
- Python
- R
- Es gibt zwar auch andere Sprachen, in denen Modelle für maschinelles Lernen wie Java, C / C ++ entworfen werden können, aber Python und R sind die am häufigsten verwendeten Sprachen.
Fazit
In diesem Artikel haben wir mit einer kurzen Einführung in das Lernen von Bestärkungen begonnen und uns dann eingehend mit der Arbeitsweise von RL und verschiedenen Faktoren befasst, die an der Arbeitsweise von RL-Modellen beteiligt sind. Dann hatten wir einige Beispiele aus der Praxis zusammengestellt, um das Thema noch besser zu verstehen. Am Ende dieses Artikels sollte man ein gutes Verständnis für die Funktionsweise des verstärkenden Lernens haben.
Empfohlene Artikel
Dies ist eine Anleitung zu Was ist Reinforcement Learning ?. Hier diskutieren wir anhand von Beispielen die Funktion und verschiedene Faktoren, die bei der Entwicklung von Reinforcement-Learning-Modellen eine Rolle spielen. Sie können auch unsere anderen verwandten Artikel durchgehen, um mehr zu erfahren -
- Arten von Algorithmen für maschinelles Lernen
- Einführung in die künstliche Intelligenz
- Künstliche Intelligenz Tools
- IoT-Plattform
- Top 6 Programmiersprachen für maschinelles Lernen