Einführung in Boxplot-Beschriftungen in R

Boxplot-Beschriftungen helfen bei der Visualisierung verteilter Daten in R. Das Diagramm zeigt den Mittelwert, den Median und die Varianz. Die Werte werden als Eingabe für das Funktions-Boxplot () angegeben. Die Boxplot () -Funktion erstellt das Boxplot mit Hilfe der angegebenen Eingabedaten. Boxplot kann für einzelne Variablen oder eine Gruppe erstellt werden.

Zeichnen des Boxplot-Diagramms

  • Wir benötigen fünf Eingabewerte wie Mittelwert, Varianz, Median, erstes und drittes Quartil.
  • Feststellen, ob die Daten Ausreißer enthalten.
  • Entwerfen Sie das Modell, um die Daten zu zeichnen.

Parameter unter der Funktion boxplot ()

  1. Formel: Mit diesem Parameter können numerische Werte in mehrere Gruppen aufgeteilt werden.
  2. Daten :: Eingabedaten, die entweder einen Datenrahmen oder eine Liste enthalten.
  3. Teilmenge: Optionaler Vektorparameter zur Angabe einer Teilmenge für das Plotten.
  4. xlab: Beschriftung auf der x-Achse
  5. ylab: Annotation auf der y-Achse.
  6. range: range gibt die Ploterweiterungen an.
  7. Aktion: Geben Sie an, was passiert, wenn ein Nullwert vorliegt. Ignorieren Sie entweder die Antwort oder den Wert.

Zufällige Daten erstellen

Wir können zufällige Stichprobendaten mit der Funktion rnorm () erstellen.

Verwenden wir nun rnorm (), um Stichprobendaten mit 10 Werten zu erstellen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Der obige Befehl generiert 10 Zufallswerte mit Mittelwert 3 und Standardabweichung = 2 und speichert sie im Datenrahmen.

Wenn wir die Daten drucken, erhalten wir die folgende Ausgabe.

Stat1

1 2.662022

2 2.184315

3 5.974787

4 4.536203

5 4.808296

6 3.817232

7 1.135339

8 1, 583991

9 3.308994

10 4.649170

Wir können die gleichen Eingaben (Daten) in die Boxplot-Funktion konvertieren, die den Plot generiert.

Wir fügen den Daten weitere Werte hinzu und sehen, wie sich das Diagramm ändert.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Hinzufügen weiterer Zufallswerte und Darstellen eines Diagramms.

Nachfolgend sind Werte aufgeführt, die in der Datenvariablen gespeichert sind.

STAT 1STAT 2STAT 3STAT 4
3.7954654, 218645, 8275852.157315
0.9117264.091196.2608112, 26594
3, 7078283.359875.889453.714557
0, 1157724, 51235, 9348582.40645
0, 6975562.159456.811472.571304
5.1292313, 26986.2500683, 025175
5.4041014.389395.6700612.9901
1.4550663.130595.6923232.69693
0, 8686365.423115.4154352.674768
2.141133, 907286.2060592.806656

Unten sehen Sie das Boxplot-Diagramm mit 40 Werten. Wir haben 1-7 Zahlen auf der y-Achse und stat1 bis stat4 auf der x-Achse.

Wir können die Textausrichtung auf der x-Achse ändern, indem wir einen anderen Parameter namens las = 2 verwenden.

Analysieren des Diagramms der R-Boxplot-Beschriftungen

Wir haben die Eingabe in den Datenrahmen gegeben und wir sehen die obige Darstellung.

Um die Daten zu verstehen, schauen wir uns die stat1-Werte an.

Das Diagramm repräsentiert alle 5 Werte. Beginnend mit dem Mindestwert von unten und dann dem dritten Quartil, dem Mittelwert, dem ersten Quartil und dem Mindestwert.

Das obige Diagramm weist eine horizontale Textausrichtung auf der x-Achse auf.

Ändern der Farbe

In allen obigen Beispielen haben wir die Handlung in Schwarzweiß gesehen. Lassen Sie uns sehen, wie Sie die Farbe im Plot ändern können.

Wir können den Parameter col = color in die Funktion boxplot () einfügen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Unten sehen wir die Grafikausgabe in rot.

Mit dem gleichen obigen Code können wir dem Plot mehrere Farben hinzufügen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Etiketten hinzufügen

Wir können Beschriftungen mit den Parametern xlab und ylab in der Funktion boxplot () hinzufügen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Mit dem Hauptparameter können wir dem Plot eine Überschrift hinzufügen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Notch-Parameter wird verwendet, um die Darstellung verständlicher zu machen. Da die Mediane von stat1 bis stat4 in der obigen Darstellung nicht übereinstimmen.

Vor- und Nachteile des Boxplots

Vorteile

  • Das Zusammenfassen großer Datenmengen ist mit Boxplot-Beschriftungen ganz einfach.
  • Zeigt den Bereich und die Datenverteilung auf der Achse an.
  • Es zeigt Symmetrie und Schiefe an
  • Hilft bei der Identifizierung von Ausreißern in den Daten.

Nachteile

  • Kann nur für numerische Daten verwendet werden.
  • Wenn die Daten nicht übereinstimmen, kann das Box-Diagramm nicht genau sein.

Anmerkungen:

  1. Diagramme müssen ordnungsgemäß beschriftet sein.
  2. Skalen sind wichtig; Durch Ändern von Maßstäben können Daten eine andere Ansicht erhalten.
  3. Der Vergleich von Daten mit korrekten Maßstäben sollte konsistent sein

Schlussfolgerung - R Boxplot-Etiketten

Die Datengruppierung wird mit Hilfe von Boxplots vereinfacht. Box-Plot unterstützt mehrere Variablen sowie verschiedene Optimierungen. Wir können die Skalen auch nach Daten variieren.

Boxplots können zum Vergleichen verschiedener Datenvariablen oder -mengen verwendet werden.

Die Benutzerfreundlichkeit von Boxplot ist einfach und bequem. Wir brauchen konsistente Daten und richtige Etiketten. Boxplots werden häufig in der Datenwissenschaft und sogar von Verkaufsteams verwendet, um Daten zu gruppieren und zu vergleichen. Boxplot gibt Einblicke in das Potenzial der Daten und Optimierungen, die zur Steigerung des Umsatzes durchgeführt werden können.

Boxplot ist eine interessante Methode zum Testen von Daten, die Aufschluss über die Auswirkung und das Potenzial der Daten gibt.

Empfohlene Artikel

Dies ist eine Anleitung zu R Boxplot-Beschriftungen. Hier besprechen wir die Parameter unter der Funktion boxplot (), wie zufällige Daten erstellt werden und wie die Farb- und Diagrammanalyse zusammen mit den Vor- und Nachteilen geändert wird. Sie können auch den folgenden Artikel lesen, um mehr zu erfahren -

  1. Arten der Datenvisualisierung
  2. Implementierung von Data Warehouse
  3. Data Science-Techniken
  4. Was ist ein Datenwürfel?

Kategorie: