Multivariate Regression - Beispiele für multivariate Regression

Inhaltsverzeichnis:

Anonim

Einführung in die multivariate Regression

  • Der Begriff "multivariat" bedeutet "Modell mit mehr als einer Variablen"
  • Multivariate Regression ist Teil der multivariaten Statistik.
  • Multivariate Regression ist eine Technik, mit der ein einzelnes Regressionsmodell geschätzt wird, wenn mehr als eine Ergebnisvariable vorhanden ist.
  • Multivariate Regression verwendet üblicherweise einen Algorithmus für maschinelles Lernen, der ein Algorithmus für überwachtes Lernen ist.

Warum funktioniert ein einzelnes Regressionsmodell nicht?

  • Wie bekannt, wird die Regressionsanalyse hauptsächlich dazu verwendet, die Beziehung zwischen einer abhängigen und einer unabhängigen Variablen zu untersuchen.
  • In der realen Welt gibt es viele Situationen, in denen viele unabhängige Variablen von anderen Variablen beeinflusst werden, sodass wir zu anderen Optionen wechseln müssen als zu einem einzelnen Regressionsmodell, das nur eine unabhängige Variable annehmen kann.

Was ist multivariate Regression?

  • Mit der multivariaten Regression können Sie den Winkel von mehr als einer unabhängigen Variablen und mehr als einer abhängigen Variablen messen. Es findet die Beziehung zwischen den Variablen (linear verwandt).
  • Es wurde verwendet, um das Verhalten der Ergebnisvariablen und die Zuordnung von Prädiktorvariablen sowie die Änderung der Prädiktorvariablen vorherzusagen.
  • Es kann auf viele praktische Bereiche wie Politik, Wirtschaft, Medizin, Forschung und viele verschiedene Arten von Unternehmen angewendet werden.
  • Multivariate Regression ist eine einfache Erweiterung der multiplen Regression.
  • Multiple Regression wird verwendet, um die Werte einer Variablen basierend auf dem kollektiven Wert von mehr als einem Wert von Prädiktorvariablen vorherzusagen und auszutauschen.
  • Zunächst werden wir anhand eines Beispiels die Verwendung der multivariaten Regression verstehen und danach nach einer Lösung für dieses Problem suchen.

Beispiele für multivariate Regression

  • Wenn E-Commerce-Unternehmen die Daten seiner Kunden wie Alter, Kaufhistorie eines Kunden, Geschlecht und Unternehmen gesammelt hat, möchten Sie die Beziehung zwischen diesen verschiedenen abhängigen und unabhängigen Variablen finden.
  • Ein Fitnesstrainer hat die Daten seines Kunden gesammelt, die in sein Fitnessstudio kommen, und möchte einige Dinge des Kunden beobachten, die Gesundheit, Essgewohnheiten (welche Art von Produkt Kunde verbraucht jede Woche), das Gewicht des Kunden sind. Dies möchte eine Beziehung zwischen diesen Variablen finden.

Wie Sie in den beiden obigen Beispielen gesehen haben, sind in beiden Situationen mehrere Variablen abhängig und einige unabhängig, sodass eine einzelne Regression nicht ausreicht, um diese Art von Daten zu analysieren.

Hier kommt die multivariate Regression ins Spiel.

1. Funktionsauswahl -

Die Auswahl der Features spielt die wichtigste Rolle bei der multivariaten Regression.

Ermitteln der Funktion, die zum Ermitteln der von dieser Funktion abhängigen Variablen erforderlich ist.

2. Normalisieren von Funktionen -

Zur besseren Analyse müssen die Funktionen skaliert werden, um sie in einen bestimmten Bereich zu bringen. Wir können auch den Wert jedes Features ändern.

3. Wählen Sie Verlustfunktion und Hypothese -

Die Verlustfunktion berechnet den Verlust, wenn die Hypothese den falschen Wert vorhersagt.

Und Hypothese bedeutet vorhergesagten Wert aus der Merkmalsvariablen.

4. Hypothesenparameter einstellen -

Stellen Sie den Hypothesenparameter ein, der die Verlustfunktion reduzieren und vorhersagen kann.

5. Minimieren Sie die Verlustfunktion

Minimieren Sie den Verlust, indem Sie einen Algorithmus zum Minimieren von Verlusten verwenden und ihn über dem Datensatz verwenden, um die Hypothesenparameter anzupassen. Sobald der Verlust minimiert ist, kann er zur Vorhersage verwendet werden.

Es gibt viele Algorithmen, die zum Reduzieren des Verlusts verwendet werden können, wie z. B. Gradientenabstieg.

6. Testen Sie die Hypothesenfunktion -

Überprüfen Sie die Hypothesenfunktion, wie korrekt sie Werte vorhersagt, und testen Sie sie anhand von Testdaten.

Schritte, um der multivariaten Regression des Archivs zu folgen

1) Importieren Sie die erforderlichen allgemeinen Bibliotheken wie Numpy, Pandas

2) Lesen Sie den Datensatz mit der Pandas-Bibliothek

3) Wie wir oben besprochen haben, müssen wir die Daten normalisieren, um bessere Ergebnisse zu erzielen. Warum Normalisierung, weil jedes Merkmal einen anderen Wertebereich hat.

4) Erstellen Sie ein Modell, das die Regression archivieren kann, wenn Sie eine lineare Regressionsgleichung verwenden

Y = mx + c

In dem x eingegeben wird, ist m eine Steigungslinie, c ist konstant, y ist die Ausgangsvariable.

5) Trainieren Sie das Modell mit Hilfe von Hyperparametern. Verstehe den Hyperparameter, setze ihn entsprechend dem Modell. Wie Lernrate, Epochen, Iterationen.

6) Wie oben erläutert, prüft die Hypothese die Hypothese und misst die Verlust- / Kostenfunktion.

7) Die Verlust- / Kostenfunktion hilft uns zu messen, wie wahr und genau der Hypothesenwert ist.

8) Durch Minimierung der Verlust- / Kostenfunktion kann das Modell die Vorhersage verbessern.

9) Die Verlustgleichung kann als Summe der quadrierten Differenz zwischen dem vorhergesagten Wert und dem tatsächlichen Wert dividiert durch die doppelte Größe des Datensatzes definiert werden.

10) Um die Verlust- / Kostenfunktion zu minimieren, verwenden Sie den Gradientenabstieg. Er beginnt mit einem zufälligen Wert und ermittelt den Punkt, an dem die Verlustfunktion am geringsten ist.

Durch Befolgen der obigen Anweisungen können wir die multivariate Regression implementieren

Vorteile der multivariaten Regression

  • Die multivariate Technik ermöglicht das Auffinden einer Beziehung zwischen Variablen oder Merkmalen
  • Es hilft, eine Korrelation zwischen unabhängigen und abhängigen Variablen zu finden.

Dis Vorteile der multivariaten Regression

  • Multivariate Techniken sind ein wenig komplexes mathematisches Rechnen auf hohem Niveau
  • Die Ausgabe des multivariaten Regressionsmodells ist nicht leicht zu interpretieren und manchmal, weil einige Verlust- und Fehlerausgaben nicht identisch sind.
  • Es kann nicht auf einen kleinen Datensatz angewendet werden, da die Ergebnisse in größeren Datensätzen einfacher sind.

Schlussfolgerung - Multivariate Regression

  • Die multivariate Regression wird hauptsächlich verwendet, wenn mehr als eine Variable verfügbar ist und in diesem Fall die lineare Regression nicht funktioniert.
  • Hauptsächlich hat die reale Welt mehrere Variablen oder Merkmale, wenn mehrere Variablen / Merkmale zum Tragen kommen. Multivariate Regression wird verwendet.

Empfohlene Artikel

Dies ist eine Anleitung zur multivariaten Regression. Hier diskutieren wir die Einführung, Beispiele für multivariate Regression sowie die Vor- und Nachteile. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. Regressionsformel
  2. Data Science Kurs in London
  3. SAS-Betreiber
  4. Data Science-Techniken
  5. Variablen in JavaScript
  6. Die wichtigsten Unterschiede zwischen Regression und Klassifikation