Einführung in R-Pakete

Das Paket ist eine Sammlung von Funktionen und Datensätzen. Pakete helfen, die Funktionalität in einer Programmiersprache zu verbessern. Wenn wir Datenbanken speichern und verarbeiten möchten (dh SQL-ähnliche Funktionen mithilfe von Datenrahmen), können wir das Paket dplyr in R verwenden. Pakete enthalten auch eine Dokumentation zur Verwendung der Funktionen und Datensätze in einem bestimmten Paket.

Wo finden wir Pakete?

Pakete sind im Internet über verschiedene Quellen erhältlich. Es gibt jedoch bestimmte vertrauenswürdige Repositorys, von denen wir die Pakete herunterladen können.

Hier sind die beiden wichtigen Repositorys, die online verfügbar sind.

  • CRAN (Comprehensive R Archive Network): Dies ist die offizielle R-Community mit einem Netzwerk aus FTP- und Webservern, die den neuesten Code und die neueste Dokumentation von R enthält. Bevor Sie Ihre Pakete online veröffentlichen, werden eine Reihe von Tests durchgeführt, die den CRAN-Richtlinien entsprechen .
  • GitHub: GitHub ist ein weiteres berühmtes Repository, aber nicht spezifisch für R. Die Online-Community kann ihre Pakete mit anderen Leuten teilen und es wird gut für die Versionskontrolle verwendet. GitHub ist Open Source und hat keinen Review-Prozess.

Liste nützlicher R-Pakete

Es gibt mehrere Pakete in R, die von CRAN oder GitHub heruntergeladen werden können. Nachfolgend finden Sie die Pakete, die für bestimmte Zwecke verwendet werden können.

1. Laden der Daten aus externen Quellen

  • Haven: R liest und schreibt Daten von SAS.
  • DBI: Um die Kommunikation zwischen der relationalen Datenbank und R herzustellen.
  • RSQlite: Es wird zum Lesen von Daten aus relationalen Datenbanken verwendet.

2. Datenmanipulation

  • Dplyr: Es wird für die Datenmanipulation wie Teilmengen verwendet, stellt Verknüpfungen für den Datenzugriff bereit und generiert SQL-Abfragen.
  • Tidyr - Es wird verwendet, um Daten in winzige Formate zu konvertieren.
  • stringr - manipuliert Zeichenkettenausdrücke und Zeichenketten.
  • lubridate - Um mit Daten und Zeit zu arbeiten.

3. Datenvisualisierung

  • Rgl: Zur Arbeit an 3D-Visualisierungen.
  • ggvis: Grammatik von Grafiken erstellen und erstellen.
  • googlevis: So verwenden Sie Google-Visualisierungstools in R.

4. Webbasierte Pakete

  1. XML: Zum Lesen und Schreiben von XML-Dokumenten in R.
  2. Httpr: Arbeiten Sie mit http-Verbindungen.
  3. Jsonlite: Zum Lesen von Json-Datentabellen.

Beziehen von R-Paketen

Wir können die verfügbaren Pakete, die in R vorhanden sind, mit dem folgenden Code überprüfen.

  • available.packages (): Im CRAN-Netzwerk sind ca. 5200 Pakete verfügbar.

CRAN verfügt über Taskansichten, die Pakete unter einem bestimmten Thema gruppieren.

R-Pakete installieren

Wir können Pakete direkt über IDE oder über Befehle installieren. Um Pakete zu installieren, verwenden wir die folgende Funktion und geben den Paketnamen an.

Syntax:

install.packages()

Code:

install.packages(“ggplot2”)

Der obige Code installiert das ggplot2-Paket und ggf. die abhängigen Pakete.

Sie können mehrere Pakete gleichzeitig installieren, indem Sie die Paketnamen unter einem Zeichenvektor angeben.

Syntax:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Code:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installation mit R Studio

Der Vorteil von R Studio ist die grafische Benutzeroberfläche (GUI). Wir können die zu installierenden Pakete und deren Quelle auswählen.

Wir können zu Tools gehen -> Pakete installieren.

Laden von R-Paketen

Nach der Installation des R-Pakets müssen diese in R geladen werden, um die installierten Pakete nutzen zu können.

Wir verwenden die folgende Funktion, um die Pakete zu laden.

Syntax:

library(package name)

Hinweis: Der Paketname muss nicht in Anführungszeichen gesetzt werden.

Code:

library(ggplot2)

Es gibt bestimmte Pakete, die beim Laden Meldungen anzeigen. Einige von ihnen nicht. Mit Hilfe des folgenden Codes können wir die Details der installierten Bibliothek sehen.

Code:

library(ggplot2)
search()

Ausgabe:

"Package: lattice" "package: ggplot2" "package: makeslides"

"Package: knitr" "package: slidify" "tools: rstudio"

Erstellen Sie Ihr eigenes Paket

Bevor wir unser eigenes Paket erstellen. Wir sollten die folgende Checkliste im Hinterkopf behalten, bevor wir mit der Erstellung eines Pakets fortfahren.

  • Das Organisieren des Codes ist eines der wichtigsten Dinge beim Schreiben von Code in das Paket. Wir verlieren die Hälfte der Zeit für die Suche nach dem Code, anstatt den Code zu verbessern. Legen Sie alle Dateien in einen leicht zugänglichen Ordner.
  • Das Dokumentieren des Codes hilft Ihnen, den Zweck des Codes zu verstehen. Wenn wir den Code nicht oft wiederholen, vergessen wir, warum wir den Code auf eine bestimmte Weise geschrieben haben. Es kann auch Menschen helfen, Ihren Code besser zu verstehen, wenn er mit ihnen geteilt wird.
  • Das Teilen der Skripte per E-Mail ist archaisch geworden. Der einfachste Weg ist, deinen Code hochzuladen und auf GitHub zu verbreiten. Möglicherweise erhalten Sie Feedback, mit dem Sie den Code verbessern können.

Um Ihr eigenes Paket zu erstellen, müssen wir das devtools-Paket installieren.

Code:

install.packages("devtools")

Um bei der Dokumentation zu helfen, können wir das folgende Paket verwenden.

Code:

install.packages("roxygen2")

Nach der Installation des Pakets devtools. Sie können Ihr eigenes Paket erstellen.

Code:

devtools::create ("packagename")

Anstelle von „Paketname“ können Sie den gewünschten Namen eingeben. Sie können jetzt Ihre Funktionen unter diesem Paket hinzufügen.

Sie können denselben Dateinamen wie Ihren Funktionsnamen erstellen.

Syntax:

Devtools:create(“firstpackage”)

Paket verteilen

Sie können Ihr Paket mit dem devtools-Paket auf github verteilen.

Wir verwenden den folgenden Code, um unser Paket auf Github zu verteilen.

Code:

devtools::install_github("yourusername/firstpackage")

Sie können Ihren github-Benutzernamen und den oben erstellten Paketnamen angeben.

Hier sind die erforderlichen Dateien für ein Paket

  • Funktionen
  • Dokumentation
  • Daten

Sobald wir alle oben genannten Dateien haben, können wir sie im Repository veröffentlichen.

Empfohlene Artikel

Dies ist eine Anleitung zu R-Paketen. Hier besprechen wir die Liste nützlicher R-Pakete, installieren Pakete mit R Studio und erstellen Ihr eigenes Paket usw. Sie können auch die folgenden Artikel lesen, um mehr zu erfahren -

  1. Was ist die Programmiersprache R?
  2. Karriere in der R-Programmierung
  3. R Programmieren gegen Python
  4. MySQL vs SQLite
  5. Liste der R-Pakete

Kategorie: