Was ist Reinforcement Learning? - Funktion und verschiedene Faktoren

Einführung in das Reinforcement Learning

Reinforcement Learning ist eine Form des maschinellen Lernens und daher auch ein Teil der künstlichen Intelligenz. Wenn es auf Systeme angewendet wird, führt das System Schritte aus und lernt basierend auf den Ergebnissen der Schritte, um ein komplexes Ziel zu erreichen, das vom System erreicht werden soll.

Reinforcement Learning verstehen

Versuchen wir, mit Hilfe von zwei einfachen Anwendungsfällen das Lernen zu vertiefen:

Fall 1

Da ist ein Baby in der Familie und sie hat gerade angefangen zu laufen und alle sind sehr glücklich darüber. Eines Tages versuchen die Eltern, ein Ziel zu setzen, lassen uns Baby die Couch erreichen und sehen, ob das Baby dazu in der Lage ist.

Ergebnis von Fall 1: Das Baby erreicht das Sofa erfolgreich und somit ist jeder in der Familie sehr froh, dies zu sehen. Der gewählte Weg wird nun mit einer positiven Belohnung belohnt.

Punkte: Belohnung + (+ n) → Positive Belohnung.

Quelle: https://images.app.goo.gl/pGCXJ1N1bzLAer126

Fall # 2

Das Baby konnte die Couch nicht erreichen und ist gefallen. Es tut weh! Was könnte der Grund sein? Auf dem Weg zur Couch könnten sich einige Hindernisse befinden, und das Baby war auf Hindernisse gestürzt.

Ergebnis von Fall 2: Das Baby fällt auf einige Hindernisse und weint! Oh, das war schlimm, lernte sie, das nächste Mal nicht in die Falle eines Hindernisses zu geraten. Der gewählte Pfad wird jetzt mit einer negativen Belohnung belohnt.

Punkte: Belohnungen + (-n) → Negative Belohnung.

Quelle: https://images.app.goo.gl/FRfd8cUqrQRLe6sZ7

Jetzt haben wir die Fälle 1 und 2 gesehen, in denen das verstärkte Lernen im Konzept dasselbe tut, mit der Ausnahme, dass es nicht menschlich ist, sondern rechnerisch ausgeführt wird.

Bewehrung schrittweise einsetzen

Lassen Sie uns das Lernen der Verstärkung verstehen, indem Sie schrittweise einen Verstärkungsagenten einführen. In diesem Beispiel ist Mario unser Agent für das Erlernen von Verstärkung. Er lernt, wie man alleine spielt:

Quelle: https://images.app.goo.gl/Kj44uvBzWzMw1QzE9

Der aktuelle Status der Mario-Spielumgebung ist S_0. Denn das Spiel hat noch nicht begonnen und der Mario ist an seinem Platz.
Als nächstes wird das Spiel gestartet und der Mario bewegt sich, der Mario, dh RL Agent, ergreift und handelt, sagen wir A_0.
Jetzt ist der Status der Spielumgebung S_1.
Außerdem wird dem RL-Agenten, dh dem Mario, jetzt ein positiver Belohnungspunkt, R_1, zugewiesen, wahrscheinlich, weil der Mario noch lebt und keine Gefahr aufgetreten ist.

Jetzt läuft die obige Schleife weiter, bis der Mario endgültig tot ist oder das Ziel erreicht ist. Dieses Modell gibt kontinuierlich die Aktion, die Belohnung und den Status aus.

Maximierungsbelohnungen

Das Ziel des verstärkten Lernens besteht darin, die Belohnungen zu maximieren, indem bestimmte andere Faktoren wie der Belohnungsrabatt berücksichtigt werden. Was unter Rabatt zu verstehen ist, werden wir in Kürze anhand einer Illustration erläutern.

Die kumulative Formel für vergünstigte Prämien lautet wie folgt:

Rabatt-Belohnungen

Lassen Sie uns dies anhand eines Beispiels verstehen:

In der gegebenen Figur ist das Ziel, dass die Maus im Spiel so viel Käse essen muss, bevor sie von einer Katze gefressen wird oder ohne Elektroschock.
Nun können wir davon ausgehen, dass je näher wir der Katze oder der elektrischen Falle sind, desto wahrscheinlicher ist es, dass die Maus gefressen oder geschockt wird.
Dies impliziert, dass es besser ist, den Käse in der Nähe zu essen, um jedes Risiko zu vermeiden, auch wenn wir den vollen Käse in der Nähe des Elektroschockblocks oder in der Nähe der Katze haben, je riskanter es ist, dorthin zu gehen.
Wir haben also einen „Block1“ mit Käse, der voll ist und weit von der Katze und dem Elektroschockblock entfernt ist, und den anderen „Block2“, der ebenfalls voll ist, sich aber entweder in der Nähe der Katze oder des Elektroschockblocks befindet, der spätere Käseblock, dh "Block2", wird in Belohnungen mehr abgezinst als der vorherige.

Quelle: https://images.app.goo.gl/8QrH78FjmRVs5Wxk8

Quelle: https://cdn-images-1.medium.com/max/800/1*l8wl4hZvZAiLU56hT9vLlg.png.webp

Arten des Verstärkungslernens

Nachfolgend sind die beiden Arten des Bestärkungslernens mit ihren Vor- und Nachteilen aufgeführt:

1. positiv

Wenn Stärke und Häufigkeit des Verhaltens aufgrund des Auftretens eines bestimmten Verhaltens zunehmen, spricht man von positivem Bestärkungslernen.

Vorteile: Die Leistung wird maximiert und die Veränderung bleibt länger bestehen.

Nachteile: Die Ergebnisse können sich verschlechtern, wenn wir zu viel Verstärkung haben.

2. Negativ

Es ist die Stärkung des Verhaltens, vor allem weil der negative Begriff verschwindet.

Vorteile: Das Verhalten ist erhöht.

Nachteile: Mit Hilfe des negativen Bestärkungslernens kann nur das minimale Verhalten des Modells erreicht werden.

Wo sollte Reinforcement Learning eingesetzt werden?

Dinge, die mit Reinforcement Learning / Beispielen gemacht werden können. Im Folgenden sind die Bereiche aufgeführt, in denen derzeit verstärktes Lernen eingesetzt wird:

Gesundheitswesen
Bildung
Spiele
Computer Vision
Geschäftsführung
Robotik
Finanzen
NLP (Natural Language Processing)
Transport
Energie

Karrieren im Reinforcement Learning

Es gibt tatsächlich einen Bericht von der Baustelle, da RL ein Zweig des maschinellen Lernens ist, laut Bericht ist maschinelles Lernen der beste Job des Jahres 2019. Unten ist die Momentaufnahme des Berichts. Nach den aktuellen Trends kommt ein Machine Learning Engineers mit einem satten Durchschnittsgehalt von 146.085 US-Dollar und einer Wachstumsrate von 344 Prozent.

Quelle: https://i0.wp.com/www.artificialintelligence-news.com/wp-content/uploads/2019/03/indeed-top-jobs-2019-best.jpg.webp?w=654&ssl=1

Fähigkeiten für das Reinforcement Learning

Nachfolgend sind die Fähigkeiten aufgeführt, die zum Erlernen der Verstärkung erforderlich sind:

1. Grundfertigkeiten

Wahrscheinlichkeit
Statistiken
Datenmodellierung

2. Programmierkenntnisse

Grundlagen der Programmierung und Informatik
Design von Software
Kann Bibliotheken und Algorithmen für maschinelles Lernen anwenden

3. Maschinelles Lernen von Programmiersprachen

Python
R
Es gibt zwar auch andere Sprachen, in denen Modelle für maschinelles Lernen wie Java, C / C ++ entworfen werden können, aber Python und R sind die am häufigsten verwendeten Sprachen.

Fazit

In diesem Artikel haben wir mit einer kurzen Einführung in das Lernen von Bestärkungen begonnen und uns dann eingehend mit der Arbeitsweise von RL und verschiedenen Faktoren befasst, die an der Arbeitsweise von RL-Modellen beteiligt sind. Dann hatten wir einige Beispiele aus der Praxis zusammengestellt, um das Thema noch besser zu verstehen. Am Ende dieses Artikels sollte man ein gutes Verständnis für die Funktionsweise des verstärkenden Lernens haben.

Empfohlene Artikel

Dies ist eine Anleitung zu Was ist Reinforcement Learning ?. Hier diskutieren wir anhand von Beispielen die Funktion und verschiedene Faktoren, die bei der Entwicklung von Reinforcement-Learning-Modellen eine Rolle spielen. Sie können auch unsere anderen verwandten Artikel durchgehen, um mehr zu erfahren -

Arten von Algorithmen für maschinelles Lernen
Einführung in die künstliche Intelligenz
Künstliche Intelligenz Tools
IoT-Plattform
Top 6 Programmiersprachen für maschinelles Lernen

Was ist Reinforcement Learning? - Funktion und verschiedene Faktoren

Inhaltsverzeichnis:

Einführung in das Reinforcement Learning

Reinforcement Learning verstehen

Fall 1

Fall # 2

Bewehrung schrittweise einsetzen

Maximierungsbelohnungen

Rabatt-Belohnungen

Arten des Verstärkungslernens

1. positiv

2. Negativ

Wo sollte Reinforcement Learning eingesetzt werden?

Karrieren im Reinforcement Learning

Fähigkeiten für das Reinforcement Learning

1. Grundfertigkeiten

2. Programmierkenntnisse

3. Maschinelles Lernen von Programmiersprachen

Fazit

Empfohlene Artikel

Gewinn vs Einkommen - 5 Die wertvollsten Unterschiede zum Lernen

So erstellen Sie eine profitable Google AdWords-Kampagne

Einige wichtige Office-Etikette-Regeln für Profis

6 Körpersprache zum Aufbau eines Best Professional Life Skills - eduCBA

Die 10 besten Möglichkeiten, in Ihren beruflichen Entwicklungsplan zu investieren - Ziele - Programm - Bedeutung

Agil im Maßstab - Konzept & Nutzen - Herausforderungen und effektive Rahmenbedingungen

Top 11 Agile Coach Interview Fragen und Antworten (Update für 2019)

Agile Vorteile - Erfahren Sie die hilfreichen Vorteile der agilen Softwareentwicklung

Agile Eigenschaften - 9 Eigenschaften der agilen Entwicklungsmethode

Aggregierte Nachfrageformel - Rechner (Beispiele mit Excel-Vorlage)

Arten von Netzwerkgeräten - Top 8 verschiedene Arten von Netzwerkgeräten

Arten von Netzwerkangriffen - Verschiedene Arten von Netzwerkangriffen

Arten von Netzwerken - Einführung und verschiedene Arten von Netzwerken

Art der Datenvisualisierung - Verschiedene Arten der Datenvisualisierung

Arten von OLAP - Lernen Sie die verschiedenen Arten von OLAP