Überblick über den R-Datenrahmen

Datenrahmen sind eine Liste von Vektoren mit gleicher Länge. Der Unterschied zwischen Matrix- und Datenrahmen besteht jedoch darin, dass die Datenrahmen verschiedene Datentypen akzeptieren. (Zeichen, Zahlen usw.). In diesem Thema lernen wir R Data Frame kennen.

Vorteile der Verwendung von Datenrahmen

  • Verteilte Sammlung von Daten und organisiert.
  • Es hat bessere Optimierungen im Vergleich zu einer relationalen Datenbank.
  • Enthält eine Vielzahl von Daten, die heterogen sind.

Erstellen eines Datenrahmens in R

Wir erstellen data_frame. Unten sehen Sie das Beispiel zum Deklarieren eines Datenrahmens.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Im obigen Beispiel haben wir die Variablen nicht definiert. Lassen Sie uns nun sehen, wie wir Variablen Werte zuweisen und diese im Datenrahmen speichern.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Ausgabe:

Zahl Alpha Booleaner

1 2 x WAHR

2 3 y WAHR

3 4 z FALSE

Struktur des Datenrahmens

Wenn wir die Struktur eines bestimmten Datenrahmens kennen wollen. Wir können die folgende Funktion verwenden.

Stern ()

str(Data_frame)

Ausgabe:

Nummer: num 2 3 4

alpha: Faktor w / 3 Stufen "x", "y", "z": 1 2 3

Boolesche Werte: logi TRUE TRUE FALSE

Extrahieren bestimmter Daten aus dem Datenrahmen

1. Verwenden Sie den Spaltennamen

Wir können einen bestimmten Datensatz aus dem Datenrahmen extrahieren.

Extrahieren wir aus unserem obigen Beispiel nur die erste Spalte aus dem Datenrahmen, die Number ist.

Data_ frame <- data. Frame(Number)

Ausgabe:

Nummer

1 2

2 3

3 4

2. Verwenden Sie die Zeilen

Wir können die Daten wie im folgenden Beispiel aus den Zeilen extrahieren.

Nehmen wir an, wir möchten nur zwei Zeilen der Spalte Number drucken.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Ausgabe:

Zahl Alpha Booleaner

1 2 x WAHR

2 3 y WAHR

3 4 z FALSE

------------

Zahl Alpha Booleaner

1 2 x WAHR

2 3 y WAHR

Wir können den Unterschied in der ersten und zweiten Ausgabe beobachten.

3. Bestimmte Zeilen und Spalten drucken

Wir können auch bestimmte Zeilen und Spalten drucken.

Im folgenden Beispiel drucken wir 1. und 2. Zeilen, Spalten

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Ausgabe:

Zahl Alpha Booleaner

1 2 x WAHR

2 3 y WAHR

3 4 z FALSE

------------

Nummer Alpha

1 2 x

2 3 y

4. Hinzufügen einer weiteren Spalte zum Datenrahmen

Wir können dem Datenrahmen eine weitere Spalte mit Werten hinzufügen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Ausgabe:

Zahl Alpha-Boolesche Klasse

1 2 x WAHR A

2 3 y WAHR B

3 4 z FALSE C

5. Hinzufügen einer Zeile zum Datenrahmen

Mit der Funktion rbind fügen wir dem vorhandenen Datenrahmen eine neue Zeile hinzu.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Ausgabe:

Zahl Alpha-Boolesche Klasse

1 2 x WAHR A

2 3 y WAHR B

3 4 z FALSE C

4 5 x FALSE D

6. Kombinieren beider Datenrahmen

Wir können auch zwei Datenrahmen kombinieren, um eine einzige Ausgabe zu erzeugen.

Um zwei Datenrahmen zu kombinieren, müssen wir dieselbe Spalte für die Datenrahmen haben.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Ausgabe:

Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
------------–
Zahl Alpha Booleaner
1 4 x WAHR
2 5 y WAHR
3 6 z FALSE

------------–

Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
4 4 x WAHR
5 5 y WAHR
6 6 z FALSE

Überprüfen von Datenrahmen

Im Folgenden sind die verschiedenen Möglichkeiten zum Überprüfen eines Datenrahmens aufgeführt. Sie enthalten Informationen zu einem Datenrahmen, genau wie bei der obigen Sternfunktion.

1. Namen - Stellt die Namen der Variablen im Datenrahmen bereit

Syntax : names(data frame name)

Beispiel

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

Ausgabe : (1) "Number" "alpha" "Booleans"

2. Zusammenfassung - Liefert die Statistik des Datenrahmens .

Syntax: summary(data frame name)

Beispiel

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Ausgabe:

Zahl Alpha Booleaner
Mindest. : 2.0 x: 1 Modus: logisch
1st Qu.:2.5 y: 1 FALSE: 1
Median: 3, 0 z: 1 WAHR: 2
Mittelwert: 3, 0 NAs: 0
3. Qu.:3.5
Max. : 4.0

3. Kopf- Stellt die Daten für die ersten Zeilen bereit .

Syntax: Head( name of the data frame)

Beispiel

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Ausgabe:

Zahl Alpha Booleaner
1 2 x WAHR
2 3 y WAHR
3 4 z FALSE
4 5 a WAHR
5 6 b FALSCH
6 7 c FALSE

4. Ende - Druckt die letzten Zeilen im Datenrahmen .

Syntax: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Ausgabe:

Zahl Alpha Booleaner
5 6 b FALSCH
6 7 c FALSE
7 8 d FALSE
8 9 f FALSCH
9 10 g FALSCH
10 11 j FALSCH

Fazit

Datenrahmen sind ein wichtiges Konzept in der R-Programmierung. Das Erstellen von Datensätzen, die geändert werden können und auf die problemlos zugegriffen werden kann, ist einfach und dennoch leistungsstark. Genau wie bei der Matrix kann auf die Datensätze über Zeilen- und Spaltennamen zugegriffen werden, wobei das Hinzufügen und Entfernen von Daten vereinfacht wird.

Empfohlene Artikel

Dies ist eine Anleitung zu R Data Frame. Hier besprechen wir das Erstellen eines Datenrahmens in R mit der Struktur und dem Extrahieren bestimmter Daten aus dem Datenrahmen. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Datentypen in C
  2. Data Science Karriere
  3. Big Data-Technologien
  4. Data Science Platform
  5. Java Booleans

Kategorie: