Einführung in Scatterplot in R

  • R ist eine Open-Source-Programmiersprache, die für Datenstatistiken und Datenanalysen verwendet wird. Mit der zunehmenden Popularität der Datenwissenschaft hat auch R an Popularität gewonnen. Es wird hauptsächlich von Datenstatisten und Data Minern zum Extrahieren wertvoller Informationen aus Daten verwendet. R ist eine interpretierte Sprache und verfügt über eine Befehlszeilenschnittstelle. Es stehen jedoch viele grafische Benutzeroberflächen zur Verfügung, um die Arbeit der Entwickler zu erleichtern. R bietet eine Vielzahl von Bibliotheken zur Implementierung von Statistiken und grafischen Techniken. R bietet statische Grafiken; Damit kann der Benutzer ein Diagramm mit Ebenen erstellen. Auf diese Weise werden Diagramme in Veröffentlichungsqualität erstellt und Informationen besser dargestellt.
  • R bietet eine Vielzahl von Bibliotheken für die grafische Implementierung, am beliebtesten ist jedoch „ggplot2“. GGPlot2 ist eine Implementierung der „Grammatik der Grafiken“, die die Erstellung komplexer Grafiken vereinfacht. Es bietet eine programmgesteuerte Schnittstelle zum Angeben von Variablen, ihrer Position, der Farbe des Diagramms, der Diagrammtypen und anderer Visualisierungseigenschaften. Sie können damit Schritt für Schritt Diagramme erstellen und Ebenen erstellen, um eine umfassende Flexibilität und Veröffentlichungsqualität zu erzielen.
  • Ein solcher Diagrammtyp ist das Streudiagramm in R. Das Streudiagramm in R, auch Streudiagramm genannt, ist ein Diagrammtyp, der die Korrelation zwischen zwei Variablen zeigt. Es zeigt die Datenpunkte in Form von Punkten. Es kann zwischen einer kontinuierlichen unabhängigen Variablen und einer anderen Variablen, die von der vorherigen Variablen abhängt, oder zwei kontinuierlichen unabhängigen Variablen gezeichnet werden. Die Korrelation kann positiv, negativ oder null sein. Wenn die Steigung des Diagramms von links unten nach rechts oben verläuft, ist die Korrelation positiv. Wenn die Steigung von links oben nach rechts unten verläuft, ist die Korrelation negativ. Mit anderen Worten, wenn der Wert einer Variablen zunimmt, nimmt der Wert einer anderen Variablen ab.

Syntax: Es gibt viele Pakete in R für Diagramme, daher gibt es viele Funktionen zum Erstellen eines Streudiagramms in R. Die grundlegendste und einfachste Funktion ist

Handlung (x, y)

wo

x bezeichnet die horizontale Achse oder die unabhängige stetige Variable.

y bezeichnet die vertikale Achse oder die abhängige Variable.

Es gibt viele andere Parameter für die Plotfunktion, um das Diagramm verständlich zu machen.

Nachfolgend einige mit einer Definition:

  • main: Fügt der Grafik einen Titel hinzu
  • xlab: Fügt der x-Achse eine Beschriftung hinzu
  • ylab: Fügt der y-Achse eine Beschriftung hinzu
  • xlim: Gibt den Bereich der x-Achse an
  • ylim: Gibt den Bereich der y-Achse an
  • pch: Gibt die Form der Punkte im Streudiagramm an
  • cex: Gibt die Größe der Punkte an
  • col: Definiert die Farbe der Punkte

Ein Streudiagramm in R kann auch mit dem Paket ggplot2 erstellt werden. Dazu müssen wir zuerst das ggplot2-Paket installieren und laden. Nach dem Hinzufügen des Pakets zur aktuellen Sitzung kann mit dem folgenden Befehl ein Streudiagramm in R erstellt werden.

ggplot (datensatz, aes (x, y, farbe, form)) + geom_poin () + labs (x, y, titel)

wo

  • Der Datensatz ist der Datensatz, für den ein Streudiagramm erstellt werden muss.
  • aes () ist eine ästhetische Abbildung in einem Diagramm. Es beschreibt, wie Variablen im Diagramm abgebildet werden.
  • x ist die horizontale Achse oder die unabhängige stetige Variable.
  • y ist die vertikale Achse oder die abhängige Variable.
  • color dient zum Hinzufügen von Farbe zu Punkten basierend auf der Gruppierungsvariable.
  • Die Form wird verwendet, um die Form basierend auf der Gruppierungsvariablen festzulegen.
  • Das + Zeichen zeigt an, dass der Befehl fortgesetzt wird.
  • geom_point () ist eine Funktion für das Streudiagramm.
  • labs (x, y, title): füge x label, y label und title zum Graphen hinzu.

Scatterplot erstellen in R

Um ein Streudiagramm in R zu erstellen, müssen wir zuerst den Datensatz laden. Hier verwenden wir den von R bereitgestellten Datensatz (mtcars). Laden Sie zuerst den Datensatz mit dem folgenden Befehl in die aktuelle Sitzung

Daten (Iris)

Zeigen Sie nach dem Laden des Datasets die Daten an, um mit dem folgenden Befehl ein grundlegendes Verständnis des Datentyps und der darin enthaltenen Spalten zu erhalten.

Iris

Nachdem Sie sich mit den Daten vertraut gemacht haben, können Sie mit der Plot-Funktion ein einfaches Streudiagramm erstellen

Plot (Iris $ Sepal.Length, Iris $ Sepal.Width, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 5, 0))

Hinzufügen von Beschriftungen, um das Diagramm lesbar zu machen

Plot (Iris $ Sepal.Length, Iris $ Sepal.Width, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = "Sepal Length", ylab = "Sepal Width", main = "Width" vs Länge ”)

Hinzufügen weiterer Parameter, um das Diagramm attraktiver zu gestalten

Plot (Iris $ Sepal.Length, Iris $ Sepal.Width, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = "Sepal Length", ylab = "Sepal Width", main = "Width" vs Length ”, pch = 8, cex = 1, 5, col = 6)

Neben diesen 2D-Plots können auch Matrix- und 3D-Plots in R erstellt werden.

Streudiagramm-Matrizen

Wenn ein Datensatz mehr als zwei Variablen enthält und eine Korrelation zwischen jeder Variablen und allen anderen Variablen ermittelt werden soll, wird die Streudiagramm-Matrix verwendet. Der grundlegendste und einfachste Befehl für die Streudiagramm-Matrix lautet:

Paare (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, Daten = Iris, Haupt = "Scatterplot Matrix")

Die obige Grafik zeigt die Korrelation zwischen Gewicht, mpg, dsp und Zyl.

Streudiagramm 3D

Manchmal ermöglicht ein dreidimensionales Diagramm ein besseres Verständnis der Daten. Hierfür stellt R mehrere Pakete zur Verfügung, eines davon ist "scatterplot3d". Im Folgenden finden Sie die Befehle zum Installieren von „scatterplot3d“ im R-Arbeitsbereich und zum Laden in die aktuelle Sitzung

install.packages ("scatterplot3d")

Bibliothek (scatterplot3d)

Nach dem Laden der Bibliothek wird durch Ausführen der folgenden Befehle ein 3D-Streudiagramm erstellt.

befestigen (Iris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = "3D Scatterplot")

Abgesehen davon gibt es viele andere Möglichkeiten, eine dreidimensionale zu erstellen. Benutzer können auch Details wie Farbe und Titel hinzufügen, um das Diagramm zu verbessern. Der Benutzer kann auch ein interaktives 3D-Streudiagramm mit der Funktion "plot3D (x, y, z)" erstellen, die im Paket "rgl" enthalten ist. Diese Funktion erstellt ein sich drehendes 3D-Streudiagramm, das mit der Maus gedreht werden kann. So erhalten Sie einen vollständigen Überblick über die Korrelation zwischen den Variablen.

Fazit

R ist eine der bekanntesten Sprachen für die Implementierung grafischer Techniken, die von Datenwissenschaftlern verwendet werden. Es bietet eine breite Palette von Paketen und Bibliotheken für Grafiken und ein besseres Verständnis der Daten. "Gglpot2", "ggvis", "rgl", "plot3d", "lattice", "animation", "gganimate", "cairo" sind einige der von R bereitgestellten Pakete.

Ein Streudiagramm ist der einfachste Weg, um die Daten besser zu verstehen. Mit dieser Visualisierung kann der Benutzer lernen, wie Variablen miteinander in Beziehung stehen, wie sich der Wert einer Variablen ändert, der Wert anderer Variablen ändert usw. Die Steigung des Diagramms gibt Aufschluss über die positive und negative Beziehung zwischen den Variablen.

Empfohlene Artikel

Dies ist eine Anleitung zum Scatterplot in R. Hier diskutieren wir eine Einführung, Scatterplot-Matrizen, Scatterplot 3D, wie man ein Scatterplot erstellt. zusammen mit entsprechenden Beispielen. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. Was ist GraphQL?
  2. Scrum Framework
  3. R Interviewfragen
  4. Einführung in die Binomialverteilung in R

Kategorie: