Einführung in Arten von Algorithmen für maschinelles Lernen

Algorithmusarten für maschinelles Lernen oder KI-Berechnungen sind Programme (Mathematik und Begründung), die sich ändern, um eine bessere Leistung zu erzielen, wenn sie für weitere Informationen bereitgestellt werden. Das „Anpassen“ eines Teils der KI impliziert, dass diese Projekte die Art und Weise ändern, in der sie Informationen nach einiger Zeit verarbeiten, genauso wie Menschen die Art und Weise ändern, in der sie Informationen durch Lernen verarbeiten. Ein maschinelles Lernen oder eine KI-Berechnung ist also ein Programm mit einer bestimmten Methode zum Ändern der eigenen Parameter, da Kritik an den Erwartungen der letzten Ausstellung an einen Datensatz angebracht ist.

Alle Arten von Algorithmen für maschinelles Lernen

Ihre bestimmten Arten der Charakterisierung der Arten von Algorithmen für maschinelles Lernen, die jedoch normalerweise je nach Motivation in Klassen unterteilt werden können, und die grundlegenden Klassifikationen sind die folgenden:

  1. Überwachtes Lernen
  2. Unbeaufsichtigtes Lernen
  3. Halbüberwachtes Lernen
  4. Verstärkung lernen

Was ist betreutes Lernen?

Betreutes Lernen ist, wo Sie berücksichtigen können, dass das Lernen von einem Ausbilder geleitet wird. Wir haben einen Datensatz, der als Pädagoge dient und dessen Aufgabe es ist, das Modell oder die Maschine vorzubereiten. Wenn das Modell vorbereitet ist, kann es beginnen, sich auf eine Erwartung oder Wahl zu einigen, wenn ihm neue Informationen gegeben werden.

Beispiel für betreutes Lernen:

  1. Sie erhalten viele Fotos mit Daten darüber, was sich auf ihnen befindet, und anschließend trainieren Sie ein Modell, um neue Fotos wahrzunehmen.
  2. Sie haben eine Menge Daten über die Immobilienpreise, basierend auf deren Größe und Standort, und Sie speisen sie in das Modell ein und trainieren sie. Dann können Sie den Preis für andere Immobilien anhand der von Ihnen eingegebenen Daten vorhersagen.
  3. Wenn Sie vorhersagen möchten, dass Ihre Nachricht Spam ist oder nicht auf älteren Nachrichten basiert, können Sie vorhersagen, dass eine neue Nachricht Spam ist oder nicht.

Der überwachte Lernalgorithmus lautet wie folgt:

1) Lineare Regression

Die lineare Regression ist nützlich, um den Zusammenhang zwischen zwei persistenten Faktoren zu entdecken. Einer ist ein Prädiktor oder eine autonome Variable und der andere ist eine Reaktions- oder Stationsvariable. Es wird nach messbaren Beziehungen gesucht, jedoch keine deterministische Beziehung. Die Verbindung zwischen zwei Faktoren soll deterministisch für die Wahrscheinlichkeit sein, dass eine Variable von der anderen präzise kommuniziert werden kann. Beispielsweise ist es bei Verwendung der Temperatur in Grad Celsius denkbar, Fahrenheit genau vorherzusagen. Die tatsächliche Beziehung ist bei der Entscheidung über einen Zusammenhang zwischen zwei Faktoren nicht genau. Zum Beispiel Verbindung irgendwo im Bereich von Größe und Gewicht. Der zentrale Gedanke ist, eine Linie zu erhalten, die am besten zu den Informationen passt. Die am besten geeignete Linie ist die, für die der gesamte prognostizierte Fehler (alle Informationsschwerpunkte) so gering ist, wie es unter den gegebenen Umständen zu erwarten wäre. Der Fehler ist die Trennung zwischen dem Punkt und der Regressionslinie.

2) Entscheidungsbäume

Ein Entscheidungsbaum ist ein Entscheidungshilfegadget, das ein baumartiges Diagramm oder Modell von Entscheidungen und deren potenziellen Ergebnissen verwendet, einschließlich Zufallsereignisergebnissen, Ressourcenkosten und Nutzen. Sehen Sie sich das Bild an, um eine Vorstellung davon zu bekommen, was es darstellt.

3) Naive Bayes Klassifikation

Naive Bayes-Klassifikation Eine Gruppe grundlegender probabilistischer Klassifikatoren, die von der Anwendung der Bayes-Theorie mit starker (ungekünstelter) Selbstverwaltung der Merkmale Naive Bayes abhängen. Diese Klassifizierung Einige der zertifizierbaren Modelle sind:

So stempeln Sie eine E-Mail als Spam oder nicht als Spam

Bestellen Sie einen Artikel über Innovation, Regierungsangelegenheiten oder Sport

Überprüfen Sie einen Hauch von Substanz, der positive Emotionen oder negative Gefühle vermittelt?

Wird für die Gesichtsbestätigungsprogrammierung verwendet.

4) Logistische Regression

Die logistische Regression ist eine bahnbrechende Methode zur Darstellung eines binomialen Ergebnisses mit mindestens einem informativen Faktor. Sie quantifiziert den Zusammenhang zwischen der absoluten Stationsvariablen und mindestens einem freien Faktor, indem Wahrscheinlichkeiten unter Verwendung einer logistischen Kapazität bewertet werden, die die kombinierte logistische Aneignung darstellt.

Normalerweise können Regressionen im wirklichen Leben verwendet werden wie:

Kredit-Score

Das Maß für die Erfolgsquote von Markt oder Unternehmen

Um den Umsatz eines Unternehmens oder eines Produkts vorherzusagen

Wird es an irgendeinem Tag ein Erdbeben geben?

5) Gewöhnliche Regression der kleinsten Quadrate

Least Squares ist eine Strategie zur Durchführung einer direkten Regression. Direkte Regression ist das Bestreben, eine Linie mit vielen Schwerpunkten zu bilden. Hierzu gibt es verschiedene mögliche Verfahren, und das System der „kleinsten Quadrate“ sieht folgendermaßen aus: Sie können eine Linie zeichnen und anschließend für alle Rechenzentren die vertikale Entfernung zwischen dem Punkt und der Linie messen und diese einbeziehen oben; Die angepasste Linie wäre der Ort, an dem diese Gruppe von Partitionen so dürftig ist, wie es angesichts der aktuellen Situation normal sein könnte.

Was ist unbeaufsichtigtes Lernen?

Das Modell lernt durch Wahrnehmung und entdeckt Strukturen in der Information. Wenn das Modell einen Datensatz erhält, werden Beispiele und Zusammenhänge im Datensatz ermittelt, indem Bündel darin erstellt werden. Was es nicht tun kann, ist, dem Bündel Markierungen hinzuzufügen, ähnlich wie es nicht aussagen kann, dass es sich um eine Ansammlung von Äpfeln oder Mangos handelt, es wird jedoch jeden einzelnen Apfel von Mangos isolieren.

Angenommen, wir haben Bilder von Äpfeln, Bananen und Mangos für das Modell angezeigt. In Anbetracht bestimmter Beispiele und Zusammenhänge wird der Datensatz durch Bündel und Partitionen in diese Gruppen unterteilt. Wenn dem Modell derzeit eine andere Information hinzugefügt wird, wird diese zu einem der erstellten Bündel hinzugefügt.

Beispiel für unbeaufsichtigtes Lernen

  1. Sie haben eine Menge Fotos von 6 Personen, die noch keine Daten darüber haben, wer auf welcher Person ist, und Sie müssen diesen Datensatz in 6 Haufen mit jeweils den Fotos einer Person isolieren.
  2. Sie haben Partikel, ein Teil davon sind Medikamente und ein Teil ist es nicht, aber Sie wissen nicht, welches welche sein wird, und Sie benötigen die Berechnung, um die Medikamente zu finden.

Der unbeaufsichtigte Lernalgorithmus lautet wie folgt

Clustering

Clustering ist eine wichtige Idee in Bezug auf das Lernen ohne Unterstützung. Zum größten Teil gelingt es ihm, eine Struktur oder ein Beispiel in einer Sammlung nicht kategorisierter Informationen zu finden. Clustering-Berechnungen verarbeiten Ihre Informationen und ermitteln charakteristische Cluster (Gruppen), falls diese in den Informationen vorhanden sind. Sie können auch die Anzahl der Trauben ändern, die von Ihren Berechnungen unterschieden werden sollen. Hiermit können Sie die Granularität dieser Zusammenstellungen ändern.

Es gibt verschiedene Arten von Clustering, die Sie verwenden können

  1. Selektiv (Zuteilung)
  2. Modell: K-bedeutet
  3. Agglomerativ
  4. Modell: Hierarchisches Clustering
  5. Abdeckung
  6. Modell: Fuzzy C-Means
  7. Probabilistisch

Clustering-Algorithmus-Typen

  1. Hierarchisches Clustering
  2. K-bedeutet Clustering
  3. K-NN (k nächste Nachbarn)
  4. Hauptkomponentenanalyse
  5. Alleine Wertzerlegung
  6. Unabhängige Komponentenanalyse
  7. Hierarchisches Clustering
Hierarchisches Clustering

Hierarchisches Clustering ist eine Berechnung, die eine Hackreihenfolge von Gruppen aufbaut. Es beginnt mit jeder einzelnen Information, die an ihre ganz eigene Gruppe verteilt wird. Hier werden sich zwei enge Gruppen in einer ähnlichen Gruppe befinden. Diese Berechnung wird beendet, wenn nur noch eine Gruppe übrig ist.

K-bedeutet Clustering

K bedeutet, dass es sich um eine iterative Clusterberechnung handelt, die Sie dazu ermutigt, den bemerkenswertesten Anreiz für jede Betonung zu finden. Zunächst wird die ideale Anzahl von Gruppen ausgewählt. Bei dieser Clustering-Technik müssen Sie die Informationen bündeln, die sich auf k Zusammenstellungen konzentrieren. Ein größeres k bedeutet weniger Ansammlungen mit einer ähnlich größeren Granularität. Ein niedrigeres k bedeutet größere Ansammlungen mit geringerer Granularität.

Der Ertrag der Berechnung ist eine Ansammlung von „Namen“. Sie ermöglicht den Hinweis auf eine der k Ansammlungen. Bei der k-Means-Gruppierung wird jede Zusammenstellung dadurch gekennzeichnet, dass für jede Zusammenstellung ein Schwerpunkt erstellt wird. Die Zentroide sind wie der Kern des Bündels, der die ihnen am nächsten liegenden Schwerpunkte fängt und sie der Gruppe hinzufügt.

K-Mean-Clustering charakterisiert weiterhin zwei Untergruppen

  1. Agglomeratives Clustering
  2. Dendrogramm
Agglomeratives Clustering

Diese Art von K-Mittel-Clustering beginnt mit einer festen Anzahl von Bündeln. Es bezeichnet alle Informationen in einer genauen Anzahl von Gruppen. Diese Clustering-Strategie erfordert nicht die Anzahl der Gruppen K als Info. Das Agglomerationsverfahren beginnt damit, dass jedes Datum als einzelnes Bündel geformt wird.

Diese Strategie verwendet ein gewisses Maß an Trennung und verringert die Anzahl der Bündel (eines in jeder Betonung) durch Kombinieren des Prozesses. Zusammenfassend haben wir eine Hauptgruppe, die jeden der Artikel enthält.

Dendrogramm

Bei der Dendrogramm-Clustering-Technik spricht jede Ebene eine denkbare Menge an. Die Höhe des Dendrogramms zeigt den Grad der Ähnlichkeit zwischen zwei Verbindungsbündeln. Je näher an der Basis des Verfahrens sie sind, desto vergleichbarer ist die Ansammlung von Dendrogrammen, die nicht charakteristisch und größtenteils abstrakt sind.

K-Nächste Nachbarn

Der nächste K-Nachbar ist der einfachste aller KI-Klassifikatoren. Es unterscheidet sich von anderen AI-Verfahren darin, dass es kein Modell liefert. Es ist eine einfache Berechnung, die jeden einzelnen zugänglichen Fall speichert und neue Beispiele in Abhängigkeit von einem Ähnlichkeitsmaß kennzeichnet.

Es funktioniert sehr gut, wenn zwischen den Modellen eine Trennung besteht. Die Lernrate ist moderat, wenn der Vorbereitungssatz enorm ist und die Trennungsfigurierung nicht trivial ist.

Hauptkomponentenanalyse

Es ist unwahrscheinlich, dass Sie einen höherdimensionalen Raum benötigen. Sie müssen einen Grund für diesen Bereich und nur die 200 wichtigsten Punkte dieser Prämisse auswählen. Diese Basis ist als Hauptkomponente bekannt. Die Teilmenge, die Sie auswählen, ist ein weiterer Bereich, der im Gegensatz zu einem eindeutigen Bereich von geringer Größe ist. Sie bewahrt jedoch einen Großteil der erwarteten Vielschichtigkeit von Informationen.

Was ist Reinforcement Learning?

Es ist die Fähigkeit eines Spezialisten, mit der Erde zusammenzuarbeiten und herauszufinden, was das beste Ergebnis ist. Es verfolgt die Idee der Treffer- und Vortechnik. Der Fahrer wird mit einem Punkt für ein Recht oder eine Off-Base-Antwort belohnt oder bestraft und anhand der positiven Belohnungsschwerpunkte die Modelleisenbahnen selbst abgeholt. Auch bereitet es sich, sobald es einmal vorbereitet ist, darauf vor, die neuen Informationen, die es eingibt, vorherzusehen.

Beispiel für Reinforcement Learning

  1. Die Anzeige von Anzeigen ist nach Ansicht von Nutzern wie Abneigungen langfristig zu optimieren
  2. Kenntnis des in Echtzeit verwendeten Anzeigenbudgets
  3. inverse Verstärkung lernen, Kunden wie Abneigungen besser zu kennen

Was ist halbüberwachtes Lernen?

Halbüberwachtes Lernen. Die Berechnung basiert auf einer Mischung aus benannten und unbeschrifteten Informationen. Normalerweise enthält diese Mischung eine begrenzte Menge an benannten Informationen und viele unbeschriftete Informationen. Die grundlegende Methode besteht darin, dass der Softwareentwickler zunächst vergleichbare Informationen unter Verwendung einer Berechnung für ununterstütztes Lernen gruppiert und anschließend die aktuell benannten Informationen verwendet, um den Rest der unbeschrifteten Informationen zu benennen. Die gewöhnlichen Verwendungsfälle einer solchen Art von Berechnung haben eine typische Eigenschaft unter sich - Das Erhalten von unbeschrifteten Informationen ist im Allgemeinen bescheiden, während das Benennen der Informationen übertrieben teuer ist. Natürlich kann man sich die drei Arten von Lernberechnungen als überwachtes Realisieren vorstellen, wenn eine Unterweisung unter der Aufsicht eines Lehrers zu Hause und in der Schule erfolgt, unbeaufsichtigt, wenn eine Unterweisung einen Sinn für eine Idee haben muss, und halbüberwachtes Realisieren, wenn eine Der Erzieher zeigt einige Ideen im Unterricht und gibt Anfragen als Schularbeiten, die von vergleichbaren Ideen abhängen.

Beispiel für halbüberwachtes Lernen

Es ist bemerkenswert, dass mehr Informationen = Modelle von besserer Qualität für fundiertes Lernen sind (bis zu einem bestimmten Punkt der Beschränkung haben wir jedoch meistens nicht so viele Informationen). Wie auch immer, das Erhalten markierter Informationen ist teuer. Für den Fall, dass Sie ein Modell erstellen müssen, um geflügelte Tiere zu unterscheiden, können Sie viele Kameras einrichten, um Geflügel zu fotografieren. Das ist im Allgemeinen bescheiden. Das Markieren dieser Fotos durch Einzelpersonen ist kostspielig. Berücksichtigen Sie die Möglichkeit, dass Sie eine enorme Anzahl von Bildern von geflügelten Tieren haben, aber beauftragen Sie nur Einzelpersonen, einen kleinen Teil der Fotos zu markieren. Wie sich herausstellte, können Sie das Modell nicht nur auf der markierten Teilmenge trainieren, sondern auf der gesamten Teilmenge vorab trainieren, bevor Sie es mit der benannten Teilmenge optimieren, und Sie zeigen Anzeichen für eine Verbesserung der Ausführung in dieser Richtung. Das ist halbüberwachtes Lernen. Es legt Ihr Geld beiseite.

Fazit

Es gibt viele Arten von Algorithmen für maschinelles Lernen, und basierend auf unterschiedlichen Bedingungen müssen wir den am besten geeigneten Algorithmus verwenden, um das beste Ergebnis zu erzielen. Es gibt viele Algorithmen, die die beste Genauigkeit für jeden Typ von maschinellem Lernalgorithmus finden und die höchste Genauigkeit, die wir für die Verwendung dieses Algorithmus benötigen. Wir können den Fehler jedes Algorithmus minimieren, indem wir das Datenrauschen reduzieren. Schließlich möchte ich sagen, dass es keinen einzigen Algorithmus zum maschinellen Lernen gibt, der Ihnen 100 Prozent Genauigkeit bietet, auch wenn das menschliche Gehirn dies nicht kann. Finden Sie den besten Algorithmus für Ihre Daten.

Empfohlene Artikel

Dies ist eine Anleitung zu Arten von Algorithmen für maschinelles Lernen. Hier diskutieren wir, was maschineller Lernalgorithmus ist, und seine Typen umfassen überwachtes Lernen, unüberwachtes Lernen, halbüberwachtes Lernen und verstärkendes Lernen. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Methoden des maschinellen Lernens
  2. Maschinelles Lernen Bibliotheken
  3. Modelle für maschinelles Lernen
  4. Frameworks für maschinelles Lernen
  5. Hyperparameter Maschinelles Lernen
  6. Hierarchisches Clustering | Agglomeratives & Divisives Clustering
  7. Entscheidungsbaum erstellen | So erstellen Sie | Vorteile
  8. Lebenszyklus des maschinellen Lernens | Top 8 Bühnen

Kategorie: