Einführung in das Histogramm in R

In diesem Artikel beginnen wir mit dem grundlegenden Histogramm in der R-Implementierung und den Anpassungen. Das Histogramm spielt eine wichtige Rolle bei der Datenanalyse zur Visualisierung der Daten. Die R-Programmierung ist eine spezielle Umgebung für statistisches Rechnen und Grundlagen für die Datenwissenschaft. In R-Programmierung werden Datensätze und Funktionen in Form von Paketen zusammengefasst. Die meisten visuellen Analyseprogramme verwenden Histogramme und verwenden standardmäßig die Behälterbreite. Sie ermöglichen es, schnell Einsichten in die Daten zu gewinnen, die eine wichtige Rolle in der Datenwissenschaft spielen. Hier erstellen wir ein Histogramm mit R-Befehlen.

Was ist ein Histogramm?

Das Histogramm ist eine bildliche Darstellung einer Datensatzverteilung, mit der wir leicht analysieren können, welcher Faktor eine höhere Datenmenge und die geringsten Daten aufweist. Mit anderen Worten, mit dem Histogramm können kumulative Frequenzdiagramme auf der x- und der y-Achse erstellt werden. Tatsächlich nehmen Histogramme sowohl gruppierte als auch nicht gruppierte Daten auf. Für ein gruppiertes Datenhistogramm werden Klassengrenzen berücksichtigt, während für nicht gruppierte Daten die gruppierte Häufigkeitsverteilung gebildet werden muss. Sie helfen dabei, Reichweite und Ort der Daten effektiv zu analysieren. Einige übliche Strukturen von Histogrammen werden während der Datenverteilung wie normale, schief stehende Klippen angewendet.

Im Gegensatz zu einem Balken weist das Diagrammhistogramm keine Lücken zwischen den Balken auf, und die Balken werden hier als Bins bezeichnet, mit denen Daten in gleichen Intervallen dargestellt werden. Histogramm Nimmt eine kontinuierliche Variable auf und teilt sie in Intervalle auf. Es ist erforderlich, die richtige Behälterbreite zu wählen. Der Hauptunterschied zwischen dem Balkendiagramm und dem Histogramm besteht darin, dass erstere Nenndatensätze zum Zeichnen verwenden, während das Histogramm die fortlaufenden Datensätze zeichnet. R verwendet die Funktion hist (), um Histogramme zu erstellen. Diese Funktion hist () verwendet einen Vektor von Werten, um das Histogramm zu zeichnen. Das Histogramm besteht aus einem Bereich kontinuierlicher Werte auf der x-Achse. Auf der y-Achse werden häufige Werte von Daten auf der x-Achse mit Balken mit Höhenunterschieden aufgezeichnet.

Syntax:

Die Syntax zum Erstellen des Histogramms lautet

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Erstellen eines Histogramms in R

Für die Analyse des Zweckhistogramms ist ein integrierter Datensatz zum Import in R. R erforderlich. Die Bibliotheken verfügen über eine Vielzahl von grafischen Paketen und Funktionen. Hier verwenden wir den Datensatz swiss and Air Passengers. Um ein Histogramm für einen bestimmten Datenwert zu berechnen, wird die Funktion hist () zusammen mit einem $ -Zeichen verwendet, um die bestimmte Datenspalte aus dem Datensatz auszuwählen und ein Histogramm zu erstellen.

Das folgende Beispiel berechnet ein Histogramm des Datenwerts in der Spalte Untersuchung des Datensatzes mit dem Namen Swiss.

Beispiel 1: Lassen Sie uns ein einfaches Histogramm erstellen

Code:

hist (swiss $Examination)

Ausgabe:

Die Liste wurde für einen Datensatz swiss mit einer Spaltenprüfung erstellt. Dadurch wird einfach ein Bin mit Frequenz und X-Achse gezeichnet.

Beispiel 2: Histogramm mit mehr Argumenten

Um ein besseres Verständnis der Histogramme zu erreichen, müssen wir der Hist-Funktion weitere Argumente hinzufügen, um die Visualisierung des Diagramms zu optimieren. Ändern der x- und y-Beschriftung in einen Wertebereich xlim- und ylim-Argumente werden der Funktion hinzugefügt.

Beispiel:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Ausgabe:

Der obige Code zeichnet ein Histogramm für die Werte aus dem Datensatz Air Passengers, gibt den Titel als "Histogram for more arg" (Histogramm für mehr Arg), die Bezeichnung auf der x-Achse als "Name List" (Namensliste) mit einem grünen Rand und einer gelben Farbe für die Balken an, indem der Wert begrenzt wird Der Wert liegt zwischen 100 und 600. Die Werte werden auf der y-Achse um 2 und die Bin-Breite um 5 erhöht.

Hinzufügen von zwei verschiedenen Farben zur Leiste

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Ausgabe:

Hinzufügen weiterer Balken zum Histogramm

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Ausgabe:

Beispiel 3: Histogramm in R Gibt einen Wert zurück

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Ausgabe:

Beispiel 4: Verwenden des Break-Arguments zum Ändern der Bin-Breite

Um mehr Haltepunkte zwischen den Breiten zu haben, ist es bevorzugt, den Wert in der c () -Funktion zu verwenden.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Ausgabe:

Das obige Diagramm zeigt die Breite des Balkens durch die Sequenzwerte.

Beispiel 5: Implementieren der Normalverteilungskurve im Histogramm

Wir werden den Datensatz 'swiss' für die Datenwerte verwenden, um eine Grafik zu zeichnen. Hier dient die Funktionskurve () zur Darstellung der Verteilungslinie.

Code:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Ausgabe:

Beispiel 6: Auftragen der Wahrscheinlichkeitsverteilung

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Erstellen von Dichtediagrammen im Histogramm in R

Die Verteilung einer Variablen wird mit function density () erstellt. Unten sehen Sie das Beispiel mit dem Datensatz mtcars. Dichtediagramme helfen bei der Verteilung der Form.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Ausgabe:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Das folgende Histogramm in R zeigt die Höhe als Untersuchung auf der x-Achse und die Dichte ist auf der y-Achse aufgetragen.

Ausgabe:

Fazit

Das ist alles über das Histogramm und genau das Histogramm ist der einfachste Weg, die Daten zu verstehen. Wie wir mit einem Histogramm gesehen haben, können wir einzelne, mehrere Diagramme zeichnen, indem wir die Bin-Breite, die Achsenkorrektur, das Ändern der Farben usw. verwenden. Das Histogramm hilft, die verschiedenen Formen der Daten zu visualisieren. Schließlich haben wir gesehen, wie das Histogramm das Analysieren von Datensätzen und Mittelpunkten ermöglicht, die als Beschriftungen der Klasse verwendet werden. Das Histogramm hilft bei der Änderung der Intervalle, eine erweiterte Beschreibung der Daten zu erstellen, und funktioniert insbesondere mit numerischen Daten. Histogramme werden in der Analyse aufgrund ihres Vorteils, eine große Menge von Daten anzuzeigen, bevorzugt. Basierend auf der Ausgabe konnten wir die Daten visuell verzerren und einfach einige Annahmen treffen.

Empfohlene Artikel

Dies war eine Anleitung zum Histogramm in R. Hier haben wir das Konzept, die Syntax und das Erstellen eines Histogramms in R anhand von Beispielen erläutert. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Histogramm-Beispiele
  2. Karriere in der R-Programmierung
  3. Balkendiagramm in Tableau
  4. Karriere in der Computerprogrammierung
  5. Wie erstelle ich ein Liniendiagramm in R?

Kategorie: