Überblick über den R-Datenrahmen
Datenrahmen sind eine Liste von Vektoren mit gleicher Länge. Der Unterschied zwischen Matrix- und Datenrahmen besteht jedoch darin, dass die Datenrahmen verschiedene Datentypen akzeptieren. (Zeichen, Zahlen usw.). In diesem Thema lernen wir R Data Frame kennen.
Vorteile der Verwendung von Datenrahmen
- Verteilte Sammlung von Daten und organisiert.
- Es hat bessere Optimierungen im Vergleich zu einer relationalen Datenbank.
- Enthält eine Vielzahl von Daten, die heterogen sind.
Erstellen eines Datenrahmens in R
Wir erstellen data_frame. Unten sehen Sie das Beispiel zum Deklarieren eines Datenrahmens.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
Im obigen Beispiel haben wir die Variablen nicht definiert. Lassen Sie uns nun sehen, wie wir Variablen Werte zuweisen und diese im Datenrahmen speichern.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Ausgabe:
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
Struktur des Datenrahmens
Wenn wir die Struktur eines bestimmten Datenrahmens kennen wollen. Wir können die folgende Funktion verwenden.
Stern ()
str(Data_frame)
Ausgabe:
Nummer: num 2 3 4
alpha: Faktor w / 3 Stufen "x", "y", "z": 1 2 3
Boolesche Werte: logi TRUE TRUE FALSE
Extrahieren bestimmter Daten aus dem Datenrahmen
1. Verwenden Sie den Spaltennamen
Wir können einen bestimmten Datensatz aus dem Datenrahmen extrahieren.
Extrahieren wir aus unserem obigen Beispiel nur die erste Spalte aus dem Datenrahmen, die Number ist.
Data_ frame <- data. Frame(Number)
Ausgabe:
Nummer
1 2
2 3
3 4
2. Verwenden Sie die Zeilen
Wir können die Daten wie im folgenden Beispiel aus den Zeilen extrahieren.
Nehmen wir an, wir möchten nur zwei Zeilen der Spalte Number drucken.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Ausgabe:
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
------------
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
Wir können den Unterschied in der ersten und zweiten Ausgabe beobachten.
3. Bestimmte Zeilen und Spalten drucken
Wir können auch bestimmte Zeilen und Spalten drucken.
Im folgenden Beispiel drucken wir 1. und 2. Zeilen, Spalten
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Ausgabe:
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
------------
Nummer Alpha
1 2 x
2 3 y
4. Hinzufügen einer weiteren Spalte zum Datenrahmen
Wir können dem Datenrahmen eine weitere Spalte mit Werten hinzufügen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Ausgabe:
Zahl Alpha-Boolesche Klasse
1 2 x WAHR A
2 3 y WAHR B
3 4 z FALSE C
5. Hinzufügen einer Zeile zum Datenrahmen
Mit der Funktion rbind fügen wir dem vorhandenen Datenrahmen eine neue Zeile hinzu.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Ausgabe:
Zahl Alpha-Boolesche Klasse
1 2 x WAHR A
2 3 y WAHR B
3 4 z FALSE C
4 5 x FALSE D
6. Kombinieren beider Datenrahmen
Wir können auch zwei Datenrahmen kombinieren, um eine einzige Ausgabe zu erzeugen.
Um zwei Datenrahmen zu kombinieren, müssen wir dieselbe Spalte für die Datenrahmen haben.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Ausgabe:
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
------------–
Zahl Alpha Booleaner
1 4 x WAHR
2 5 y WAHR
3 6 z FALSE
------------–
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
4 4 x WAHR
5 5 y WAHR
6 6 z FALSE
Überprüfen von Datenrahmen
Im Folgenden sind die verschiedenen Möglichkeiten zum Überprüfen eines Datenrahmens aufgeführt. Sie enthalten Informationen zu einem Datenrahmen, genau wie bei der obigen Sternfunktion.
1. Namen - Stellt die Namen der Variablen im Datenrahmen bereit
Syntax : names(data frame name)
Beispiel
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
Ausgabe : (1) "Number" "alpha" "Booleans"
2. Zusammenfassung - Liefert die Statistik des Datenrahmens .
Syntax: summary(data frame name)
Beispiel
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Ausgabe:
Zahl Alpha Booleaner
Mindest. : 2.0 x: 1 Modus: logisch
1st Qu.:2.5 y: 1 FALSE: 1
Median: 3, 0 z: 1 WAHR: 2
Mittelwert: 3, 0 NAs: 0
3. Qu.:3.5
Max. : 4.0
3. Kopf- Stellt die Daten für die ersten Zeilen bereit .
Syntax: Head( name of the data frame)
Beispiel
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Ausgabe:
Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
4 5 a WAHR
5 6 b FALSCH
6 7 c FALSE
4. Ende - Druckt die letzten Zeilen im Datenrahmen .
Syntax: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Ausgabe:
Zahl Alpha Booleaner
5 6 b FALSCH
6 7 c FALSE
7 8 d FALSE
8 9 f FALSCH
9 10 g FALSCH
10 11 j FALSCH
Fazit
Datenrahmen sind ein wichtiges Konzept in der R-Programmierung. Das Erstellen von Datensätzen, die geändert werden können und auf die problemlos zugegriffen werden kann, ist einfach und dennoch leistungsstark. Genau wie bei der Matrix kann auf die Datensätze über Zeilen- und Spaltennamen zugegriffen werden, wobei das Hinzufügen und Entfernen von Daten vereinfacht wird.
Empfohlene Artikel
Dies ist eine Anleitung zu R Data Frame. Hier besprechen wir das Erstellen eines Datenrahmens in R mit der Struktur und dem Extrahieren bestimmter Daten aus dem Datenrahmen. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -
- Datentypen in C
- Data Science Karriere
- Big Data-Technologien
- Data Science Platform
- Java Booleans