Einführung in betreutes Lernen und unbeaufsichtigtes Lernen

Betreutes Lernen und unbeaufsichtigtes Lernen sind maschinelle Lernaufgaben.
Überwachtes Lernen ist einfach ein Prozess des Lernens eines Algorithmus aus dem Trainingsdatensatz. Beim überwachten Lernen verfügen Sie über Eingabevariablen und eine Ausgabevariable, und Sie verwenden einen Algorithmus, um die Zuordnungsfunktion von der Eingabe zur Ausgabe zu lernen. Ziel ist es, die Zuordnungsfunktion so zu approximieren, dass wir bei neuen Eingabedaten die Ausgabevariablen für diese Daten vorhersagen können.

Beim unbeaufsichtigten Lernen wird die zugrunde liegende oder verborgene Struktur oder Verteilung in den Daten modelliert, um mehr über die Daten zu erfahren. Beim unbeaufsichtigten Lernen haben Sie nur Eingabedaten und keine entsprechenden Ausgabevariablen.

Trainingsdatensatz: Eine Reihe von Beispielen für das Lernen, bei denen der Zielwert bekannt ist.

Head-to-Head-Vergleiche zwischen überwachtem und nicht überwachtem Lernen (Infografiken)

Unten ist der Top-7-Vergleich zwischen betreutem Lernen und unbeaufsichtigtem Lernen

Hauptunterschiede zwischen überwachtem und nicht überwachtem Lernen

Nachstehend sind die Punktelisten aufgeführt, in denen die wichtigsten Unterschiede zwischen überwachtem und nicht überwachtem Lernen beschrieben sind

1. Algorithmen für maschinelles Lernen erkennen Muster in Big Data. Diese verschiedenen Algorithmen können in zwei Kategorien eingeteilt werden, basierend auf der Art und Weise, wie sie Daten „lernen“, um Vorhersagen zu treffen. Diese sind überwachtes und unbeaufsichtigtes Lernen.

2. Beim überwachten Lernen fungiert der Wissenschaftler als Leitfaden, um dem Algorithmus zu vermitteln, welche Schlussfolgerungen oder Vorhersagen er treffen sollte. Beim unbeaufsichtigten Lernen gibt es keine richtige Antwort, es gibt keinen Lehrer. Die Algorithmen bleiben ihren eigenen überlassen, um die interessante verborgene Struktur in den Daten zu entdecken und darzustellen.

3. Das überwachte Lernmodell verwendet die Trainingsdaten, um eine Verknüpfung zwischen den Eingaben und den Ausgaben zu lernen.

4. Unbeaufsichtigtes Lernen verwendet keine Ausgabedaten. Beim unbeaufsichtigten Lernen sind sie keine gekennzeichneten Vorkenntnisse, wohingegen beim beaufsichtigten Lernen der Zugriff auf die Kennzeichnungen und Vorkenntnisse über die Datensätze möglich sind

5. Überwachtes Lernen: Die Idee ist, dass das Training verallgemeinert werden kann und dass das Modell mit einer gewissen Genauigkeit auf neue Daten angewendet werden kann.

6. Überwachte Lernalgorithmen: Support-Vektor-Maschine, lineare und logistische Regression, neuronales Netz, Klassifikationsbäume und zufällige Wälder usw.

7. Unüberwachte Algorithmen können in verschiedene Kategorien unterteilt werden: Cluster-Algorithmen, K-Mittelwerte, Hierarchisches Clustering, Dimensionsverringerungsalgorithmen, Anomalieerkennungen usw.

8. Klassifikations- und Regressionsbereich weit verbreitete Algorithmen beim überwachten Lernen. Support Vector Machines (SVM) sind überwachte maschinelle Lernmodelle mit zugehörigen Lernalgorithmen, die sowohl für Klassifizierungs- als auch für Regressionszwecke verwendet werden können, jedoch hauptsächlich für Klassifizierungsprobleme verwendet werden.

9. Im SVM-Modell zeichnen wir jedes Datenelement als einen Punkt im n-dimensionalen Raum (wobei n für die vorhandenen Features steht), wobei die Werte der einzelnen Features der Wert einer bestimmten Koordinate sind. Dann erfolgt die Klassifizierung durch Auffinden der Hyperebene, die die beiden Klassen unterscheidet.

10.Das Hauptziel von Regressionsalgorithmen ist die Vorhersage des diskreten oder fortgesetzten Werts. In einigen Fällen kann der vorhergesagte Wert verwendet werden, um die lineare Beziehung zwischen den Attributen zu identifizieren. Basierend auf der Problemdifferenz können Regressionsalgorithmen verwendet werden. Einige der grundlegenden Regressionsalgorithmen sind lineare Regression, polynomiale Regression usw.

11.Clustering wird häufig beim unbeaufsichtigten Lernen eingesetzt. Clustering ist die Aufgabe, die Datenpunkte in eine Anzahl von Gruppen zu unterteilen, sodass die gleichen Merkmalspunkte in Form von Clustern zusammengefasst werden. Es gibt mehr Clustering-Algorithmen. Einige davon sind Konnektivitätsmodelle, Schwerpunktmodelle, Verteilungsmodelle und Dichtemodelle.

12.Hierarchisches Clustering fällt unter unbeaufsichtigtes Lernen. Hierarchisches Clustering ist, wie der Name schon sagt, ein Algorithmus, der eine Hierarchie von Clustern aufbaut. Dieser Algorithmus beginnt mit allen Datenpunkten, die einem eigenen Cluster zugewiesen sind. Dann werden zwei nächstgelegene Cluster zu demselben Cluster zusammengeführt. Am Ende wird dieser Algorithmus beendet, wenn nur noch ein einziger Cluster übrig ist.

13.KMeans fällt unter die nicht überwachte Clustermethode. Die Daten werden basierend auf ihren Funktionen in k Cluster unterteilt. Jeder Cluster wird durch seinen Schwerpunkt dargestellt, der als Mittelpunkt der Punkte im Cluster definiert ist. KMeans ist einfach und schnell, liefert jedoch nicht bei jedem Lauf das gleiche Ergebnis.

14. Um das überwachte und das unbeaufsichtigte Lernen besser zu verstehen, nehmen wir Beispiele aus der Praxis. Überwachtes Lernen: Nehmen wir als Beispiel eine der Funktionen von Google Mail, eine Spam-Mail. Basierend auf früheren Informationen zu Spam-E-Mails, Herausfiltern einer neuen eingehenden E-Mail in den Ordner "Posteingang" oder "Junk". In diesem Szenario wird in Google Mail eine Zuordnungsfunktion modelliert, um die eingehenden E-Mails basierend auf dem Vorwissen über die E-Mails zu trennen. Dies wird beim Lernen überwacht.

15. Unbeaufsichtigtes Lernen: Nehmen wir an, eine Freundin lädt Sie zu ihrer Party ein, auf der Sie neue Leute kennenlernen. Jetzt klassifizieren Sie sie ohne Vorkenntnisse (unbeaufsichtigtes Lernen), und diese Klassifizierung kann sich auf eine beliebige Eigenschaft beziehen. Dies kann die Altersgruppe, das Geschlecht, die Kleidung, der Bildungsabschluss oder eine andere Art sein, die Sie möchten. Da Sie keine Vorkenntnisse über Personen verwendet und diese klassifiziert haben, fällt dies unter unbeaufsichtigtes Lernen.

Vergleichstabelle für betreutes Lernen und unbeaufsichtigtes Lernen

Überwachtes LernenUnbeaufsichtigtes Lernen

Methode

Eingangsvariablen und Ausgangsvariablen werden angegeben.Es werden nur Eingabedaten angegeben

Tor

Überwachtes Lernziel ist es, die Funktion so gut zu bestimmen, dass bei neuem Eingabedatensatz die Ausgabe vorhergesagt werden kann.Das unbeaufsichtigte Lernziel besteht darin, die verborgenen Muster oder die zugrunde liegende Struktur in den gegebenen Eingabedaten zu modellieren, um etwas über die Daten zu lernen.

Klasse

Probleme beim maschinellen Lernen, Data Mining und neuronales Netzwerk,Maschinelles Lernen, Data Mining, Probleme und neuronales Netzwerk

Beispiele

  • Einstufung
  • Regression
  • Lineare Regression
  • Unterstützung vektor maschine
  • Clustering
  • Verband
  • k-bedeutet
  • Verband
Wer benutztDatenwissenschaftlerDatenwissenschaftler

Ökosysteme

Big Data Processing, Data Mining usw

Big Data Processing, Data Mining usw

Verwendet

Überwachtes Lernen wird häufig für Exportsysteme in den Bereichen Bilderkennung, Spracherkennung, Prognose, Finanzanalyse und Training von neuronalen Netzen und Entscheidungsbäumen usw. Verwendet

Unüberwachte Lernalgorithmen werden verwendet, um die Daten während der explorativen Analyse vorzuverarbeiten oder überwachte Lernalgorithmen vorab zu trainieren.

Fazit - Betreutes Lernen versus unbeaufsichtigtes Lernen

Die Wahl eines überwachten oder unbeaufsichtigten Algorithmus für maschinelles Lernen hängt in der Regel von Faktoren ab, die sich auf die Struktur und das Volumen Ihrer Daten sowie auf den Anwendungsfall beziehen. In der Realität verwenden Datenwissenschaftler in den meisten Fällen sowohl den Ansatz des überwachten als auch den des unbeaufsichtigten Lernens, um den Anwendungsfall zu lösen.

Empfohlener Artikel

Dies war ein Leitfaden für betreutes Lernen im Vergleich zu unbeaufsichtigtem Lernen, deren Bedeutung, Kopf-an-Kopf-Vergleich, Hauptunterschiede, Vergleichstabelle und Schlussfolgerung. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Best 7 Vergleich zwischen Supervised Learning und Reinforcement Learning
  2. 5 Der nützlichste Unterschied zwischen Data Science und maschinellem Lernen
  3. Erfahren Sie die 10 besten Unterschiede zwischen Map Reduce und Yarn
  4. MapReduce vs Apache Spark - 20 nützliche Vergleiche zum Lernen
  5. Was ist Reinforcement Learning?

Kategorie: