Einführung in die Polynom-Regression
Regression ist definiert als die Methode zur Ermittlung der Beziehung zwischen unabhängigen und abhängigen Variablen zur Vorhersage des Ergebnisses. Das erste polynomielle Regressionsmodell wurde 1815 von Gergonne verwendet. Es wird verwendet, um die am besten passende Linie unter Verwendung der Regressionslinie zur Vorhersage der Ergebnisse zu finden. Es gibt viele Arten von Regressionstechniken, die polynomiale Regression ist eine davon. Bevor Sie dies verstehen, ist es ratsam, die lineare Regression genau zu kennen, damit Sie die Unterschiede zwischen ihnen leicht erkennen können.
Warum Polynom-Regression?
- Dies ist eine der Regressionstechniken, die von den Fachleuten verwendet wird, um das Ergebnis vorherzusagen. Es ist als die Beziehung zwischen der unabhängigen und der abhängigen Variablen definiert, wenn die abhängige Variable mit der unabhängigen Variablen mit einem n-ten Grad in Beziehung steht. Es ist nicht erforderlich, dass die Beziehung zwischen abhängigen und unabhängigen Variablen linear ist. Wenn die Linie also eine Kurve ist, kann sie einen Polynomterm haben.
- Der Hauptunterschied zwischen linearer und polynomialer Regression besteht darin, dass für die lineare Regression eine lineare Beziehung zwischen abhängigen und unabhängigen Variablen erforderlich ist. Dies passt möglicherweise besser zur Geraden, wenn wir einen höheren Grad für den Ausdruck der unabhängigen Variablen in die Gleichung einbeziehen. Die Gleichung der Polynomregression mit einem n-ten Grad kann wie folgt geschrieben werden:
Y = b0 + a1x + a2x 2 + a3x 3 +…. angst n
- Wenn wir höhere Grade wie Quadratisch hinzufügen, wird die Linie in eine Kurve umgewandelt, die besser zu den Daten passt. Im Allgemeinen wird es verwendet, wenn die Punkte im Datensatz gestreut sind und das lineare Modell das Ergebnis nicht klar beschreiben kann. Wir sollten immer ein Auge auf Über- und Unteranpassung haben, wenn wir diese Grade in die Gleichung einbeziehen.
- Es ist besser, den Grad zu berücksichtigen, der alle Datenpunkte durchläuft, aber manchmal kann ein höherer Grad wie 10 oder 20 alle Datenpunkte durchlaufen und den Fehler verringern, erfasst aber auch das Rauschen der Daten, die das Modell und überpassen Sie können dies vermeiden, indem Sie dem Trainingsdatensatz weitere Stichproben hinzufügen. Es ist daher immer ratsam, einen für das Modell optimalen Grad zu wählen.
Es gibt zwei Techniken, mit denen der Grad der Gleichung bestimmt wird:
- Vorwärtsauswahl: Dies ist die Methode zum Erhöhen des Grades, bis es für die Definition des Modells signifikant genug ist.
- Rückwärtsauswahl: Dies ist die Methode, um den Grad zu verringern, bis er für die Definition des Modells signifikant genug ist.
Vorgehensweise zum Anwenden der Polynom-Regression
Führen Sie die folgenden Schritte oder Verfahren aus, um eine Polynomregression auf einen beliebigen Datensatz anzuwenden:
Schritt 1: Importieren Sie den entsprechenden Datensatz auf eine beliebige Plattform (R oder Python) und installieren Sie die für die Anwendung des Modells erforderlichen Pakete.
Schritt 2: Teilen Sie den Datensatz in Trainings- und Testsätze auf, damit wir den Algorithmus auf den Trainingsdatensatz anwenden und ihn mit dem Testdatensatz testen können.
Schritt 3: Wenden Sie explorative Datenanalysemethoden an, um den Hintergrund der Daten wie Mittelwert, Median, Modus, erstes Quartil, zweites Quartil usw. zu untersuchen.
Schritt 4: Wenden Sie den linearen Regressionsalgorithmus auf den Datensatz an und untersuchen Sie das Modell.
Schritt 5: Wenden Sie den Polynom-Regressionsalgorithmus auf den Datensatz an und untersuchen Sie das Modell, um die Ergebnisse entweder im RMSE- oder im R-Quadrat zwischen linearer Regression und polynomialer Regression zu vergleichen.
Schritt 6: Visualisieren und vorhersagen, sowohl die Ergebnisse der linearen und Polynomregression und identifizieren, welches Modell den Datensatz mit besseren Ergebnissen vorhersagt.
Polynom Regression verwendet
- Es wird in vielen experimentellen Verfahren verwendet, um das Ergebnis unter Verwendung dieser Gleichung zu erhalten.
- Es bietet eine klar definierte Beziehung zwischen den unabhängigen und abhängigen Variablen.
- Es wird verwendet, um die Isotope der Sedimente zu untersuchen.
- Es wird verwendet, um den Aufstieg verschiedener Krankheiten in einer Population zu untersuchen.
- Es wird verwendet, um die Erzeugung einer Synthese zu untersuchen.
Merkmale der Polynom-Regression
- Es ist eine Art nichtlineare Regressionsmethode, die die Beziehung zwischen der unabhängigen und der abhängigen Variablen angibt, wenn die abhängige Variable mit der unabhängigen Variablen des n-ten Grades in Beziehung steht.
- Die Best-Fit-Linie wird durch den Grad der Polynom-Regressionsgleichung bestimmt.
- Das aus der Polynom-Regression abgeleitete Modell wird von den Ausreißern beeinflusst. Es ist daher immer besser, Ausreißer zu behandeln, bevor der Algorithmus auf den Datensatz angewendet wird.
- Die Funktion Polynomialfeature () wird abhängig vom Grad der Gleichung in ein Merkmal der Matrix umgewandelt.
- Die Art der Kurve kann mithilfe eines einfachen Streudiagramms untersucht oder visualisiert werden, mit dem Sie eine bessere Vorstellung von der Linearitätsbeziehung zwischen den Variablen erhalten und entsprechend entscheiden können.
Fazit
Polynom-Regression wird in vielen Organisationen verwendet, wenn sie eine nichtlineare Beziehung zwischen den unabhängigen und abhängigen Variablen identifizieren. Dies ist eine der schwierigsten Regressionstechniken im Vergleich zu anderen Regressionsmethoden. Wenn Sie also über den Ansatz und den Algorithmus genau Bescheid wissen, können Sie bessere Ergebnisse erzielen.
Empfohlene Artikel
Dies ist ein Leitfaden für eine Polynom-Regression. Hier diskutieren wir die Merkmale und die Verwendung der Polynom-Regression. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren.
- SVM-Algorithmus
- Kernel-Methoden
- LINEST Excel-Funktion
- Algorithmen für maschinelles Lernen
- Lineare Regression vs Logistische Regression | Top Unterschiede