Zweiweg-ANOVA in R - Zwei-Wege-ANOVA-Test in R Easy Guide - Beispiele

Inhaltsverzeichnis:

Anonim

Übersicht über die Zweiwege-ANOVA in R

Die Zwei-Wege-ANOVA (Varianzanalyse) hilft uns, die Beziehung zwischen einer kontinuierlichen abhängigen Variablen und zwei kategorisch unabhängigen Variablen zu verstehen. In diesem Thema lernen wir Two Way ANOVA in R kennen.

Im Folgenden finden Sie die Hypothese von Interesse unter Zwei-Wege-ANOVA

  1. H₀: Nenne es den Haupteffekt, der der erste Faktor ist, der von der stetigen Variablen abhängt
  2. H₀: Der Haupteffekt betrifft auch die Auswirkung auf die zweite Variable auf die abhängige stetige Variable.
  3. H₀: Interaktion ist der kombinierte Effekt der ersten und der zweiten Faktorvariablen auf die abhängige Variable

Nachfolgend sind die Normen aufgeführt, die eine Zwei-Wege-ANOVA erfüllen muss.

  1. Die Beobachtungen müssen unabhängig sein
  2. Die Beobachtungen sollten normal verteilt sein.
  3. Die Beobachtungen sollten gleichermaßen unterschiedlich sein
  4. Keine Ausreißer im Design
  5. Fehler sollten unabhängig sein.

Hinweis

Wir müssen unsere Daten transformieren, wenn Normalität und gleiche Varianz verletzt werden.

Beispiel einer Zweiweg-ANOVA in R

Lassen Sie uns einen Einweg-ANOVA-Test für einen Krebsleveldatensatz durchführen, der 48 Zeilen und 3 Datenvariablen enthält:

Aufgenommene Zeit: Überlebenszeit eines Tieres

Verschiedene Krebsniveaus 1 - 3

Behandlung: Behandlungen von 1-3

Bevor wir testen, benötigen wir die folgenden Daten in der Hand.

  • Daten importieren
  • Nicht benötigte Variable entfernen
  • Konvertieren Sie Variablen (Krebslevel) als geordnetes Level.

Unten ist der Datensatz.

Bemerkungen: 48

Variablen: 3

Überlebenszeit 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…

Krebsstufen 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…

Behandlung A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Ziele

  1. H & spplus ;: keine Änderung der durchschnittlichen Überlebenszeit zwischen den Gruppen
  2. H₀: Die Überlebenszeit ist für mindestens eine Gruppe unterschiedlich.

Schritte

  • Überprüfen Sie die Krebsraten. Wir können drei Zeichenwerte sehen, weil wir sie mit einem mutierten Verb in Faktoren umwandeln.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Berechnen Sie sowohl den Mittelwert als auch die Standardabweichung

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Ausgabe:

Ein tibble: 3 x 4

Krebslevel count_cancerlevel mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • In Schritt drei können Sie grafisch prüfen, ob zwischen den Verteilungen ein Unterschied besteht. Beachten Sie, dass Sie den gestörten Punkt einfügen.
  • Führen Sie den Test mit dem Befehl AOV aus.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Syntax:

y ~ X1 + X2 +… + Xn (X1 + X2 +… bezieht sich auf die unabhängigen Variablen)

y ~. Verwenden Sie alle verbleibenden Variablen als unabhängige Variablen

Stellen Sie sicher, dass Sie das Modell speichern und die Zusammenfassung ausdrucken.

Code

  • aov (Zeit ~ Krebsniveau, Daten = df): Führen Sie den ANOVA-Test mit der folgenden Formel durch
  • summary (anova_one_way): Gibt die Zusammenfassung des Tests aus

Df Sum Sq Mean Sq F-Wert Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05

Rückstände 45 1, 972 0, 0438

-

Signif. Codes: 0 "***" 0, 001 "**" 0, 01 "*" 0, 05 ". 0, 1 '' 1

Der p-Wert liegt unter der Schwelle von 0, 05. Die statistische Differenz ist im obigen Fall mit '*' gekennzeichnet.

One Way Test zu Two Way Anova in R

Lassen Sie uns sehen, wie der Einweg-Test auf die Zweiweg-ANOVA erweitert werden kann. Der Test ähnelt der Einweg-ANOVA, die Formel unterscheidet sich jedoch und fügt der Formel eine weitere Gruppenvariable hinzu.

y = x1 + x2

  • H0 : Die Mittelwerte sind für beide Variablen gleich (Faktorvariablen)
  • H3 : Die Mittelwerte sind für beide Variablen unterschiedlich

Sie fügen unserem Modell Treat-Variablen hinzu. Diese Variable gibt die dem Patienten verabreichte Behandlung an. Sie möchten wissen, ob eine statistische Abhängigkeit zwischen der Krebsrate und der Behandlung des Patienten besteht.

Wir passen unseren Code an, indem wir einen Treat mit der anderen unabhängigen Variablen hinzufügen.

Df Sum Sq Mean Sq F-Wert Pr (> F)

Krebslevel 2 1.0330 0.5165 20.64 5.7d-07 ***

Treat 3 0.9212 0.3071 12.27 6.7e-06

Rückstände 42 1, 0509 0, 0250

Sowohl die Krebsrate als auch die Behandlung unterscheiden sich statistisch von 0. Auf diese Weise können wir die NULL-Hypothese zurückweisen. Stellen Sie außerdem sicher, dass eine Änderung der Behandlung oder der Krebsart die Überlebenszeit beeinflusst.

Prüfung

Einweg-ANOVA: H3-Durchschnitt ist für mindestens eine Gruppe unterschiedlich

Zweiwege-ANOVA: Der H3-Durchschnitt ist für beide Gruppen unterschiedlich.

Unterschied zwischen Einweg- und Zweiweg-ANOVA

Unterschiede zwischen Einweg-ANOVA und Zweiweg-ANOVA

Einweg-ANOVAZweiwege-ANOVA
Entwarf, Gleichheitsprüfung zwischen 3 oder mehr Mitteln zu ermöglichenEntwickelt, um die Beziehung zwischen zwei unabhängigen Variablen und einer abhängigen Variablen zu bewerten.
Bezieht eine unabhängige Variable einUmfasst zwei unabhängige Variablen
Analysiert in 3 oder mehr kategorialen Gruppen.Vergleicht mehrere Gruppen von zwei Faktoren
Muss zwei Prinzipien erfüllen - Replikation und RandomisierungMuss drei Prinzipien erfüllen: Replikation, Randomisierung und lokale Kontrolle.

Vorteile der Zweiwege-ANOVA

  • Im obigen Beispiel helfen das Alter und das Geschlecht in unserem Beispiel dabei, Fehlervariationen zu reduzieren und das Design effizienter zu gestalten.
  • Mit der bidirektionalen ANOVA können wir die Wirkung von zwei Faktoren gleichzeitig testen.

Anwendungen von ANOVA

  1. Vergleich der Laufleistung verschiedener Fahrzeuge, Kraftstoff- und Straßentypen.
  2. Den Einfluss von Temperatur, Druck oder chemischer Konzentration auf eine chemische Reaktion kennenlernen (Leistungsreaktoren, Chemieanlagen usw.)
  3. Einfluss verschiedener Katalysatoren auf chemische Reaktionsgeschwindigkeiten
  4. Verständnis der Auswirkungen von Werbung und der unterschiedlichen Anzahl von Kundenreaktionen.
  5. Einfluss von Leistung, Qualität und Geschwindigkeit der Herstellung in der Biologie (Prozess basiert auf der Anzahl der Zellen, in die sie unterteilt werden)

Empfohlene Artikel

Dies ist eine Anleitung zur Zwei-Wege-ANOVA in R. Hier werden die Beispiele, Ziele, Schritte und Unterschiede zwischen der Ein-Wege-ANOVA und der Zwei-Wege-ANOVA erläutert. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. ANOVA in R
  2. Interpretation der Ergebnisse mit dem ANOVA-Test
  3. Regression gegen ANOVA
  4. GLM in R