Einführung in die Liste der R-Pakete

Ein Paket in der Programmiersprache R ist eine Einheit, die die erforderlichen Funktionen bereitstellt, die durch Laden in die R-Umgebung verwendet werden können. Eine Liste von R-Paketen ähnelt einer Bibliothek in C, C ++ oder Java. Im Grunde genommen kann ein Paket also zahlreiche Funktionalitäten wie Funktionen, Konstanten usw. aufweisen, mit denen der Benutzer sie im Kontext eines bestimmten Problems verwenden kann. In R kann ein erforderliches Paket mit der Funktion library () geladen werden. Falls ein Paket nicht vorhanden ist, kann es mit der Funktion install.packages () installiert werden. Pakete erleichtern scheinbar schwierige Aufgaben durch ihre vorgefertigten Funktionen.

Was sind R-Pakete?

Es gibt viele Pakete in R, und die Auswahl eines Pakets hängt von seiner Anwendung ab. Obwohl es bestimmte Pakete gibt, die aufgrund der von ihnen bereitgestellten Funktionen häufig verwendet werden, ist es nicht so, dass andere Pakete weniger wichtig sind. Unterschiedliche Pakete haben unterschiedliche Zwecke. Einige beziehen sich auf statistische Techniken, andere auf Visualisierungen usw.

Im folgenden Abschnitt werden wir uns einige der wichtigen Pakete in R ansehen:

1. Auto

Dieses Paket ist Begleiter der angewandten Regression. Es ist ein großes Paket, das verschiedene Funktionen für die statistische Analyse bietet. Durch das Importieren dieses Pakets in die R-Umgebung werden andere verwandte Pakete wie MASS, Statistiken, Grafiken usw. importiert. Einige der Funktionen in dem Paket umfassen Anova, avPlots, Boxplot, CarPalette, Dichtediagramme, infIndexPlot, lineare Hypothese, Logit, Ausreißertest, qqPlot, Residuendiagramme, Scatterplot, Scatterplot-Matrix usw. Die umfangreichen Funktionen des Pakets lassen sich anhand der Anzahl der bereitgestellten Funktionen beurteilen.

2. Corrplot

Das Paket bietet eine grafische Darstellung einer Korrelationsmatrix und eines Konfidenzintervalls. Das Paket enthält auch Algorithmen zur Durchführung der Matrixumordnung. Zu den zahlreichen Optionen gehören die Auswahl der erforderlichen Farben, Textbeschriftungen, Farbbeschriftungen, Layouts usw. Verschiedene Visualisierungsmethoden oder Parametermethoden im Corrplot-Paket sind "Kreis", "Quadrat", "Ellipse", "Zahl", "Schatten", "Farbe". und "Kuchen". Die Corrplot-Funktion mit verschiedenen Optionen bietet eine visuell ansprechende Darstellung der Korrelation zwischen verschiedenen Variablen, die ansonsten unter normalen Umständen wie Zahlen schwer zu interpretieren sind. Positive Korrelationen werden in blau und negative Korrelationen in rot angezeigt. Die Intensität der Farbe und die Größe des Kreises sind proportional zu den Korrelationskoeffizienten.

3. DataExplorer

Dieses Paket befasst sich mit der automatisierten Datenexploration und -behandlung. Es bietet einen automatisierten Datenexplorationsprozess für analytische Aufgaben und prädiktive Modellierung. Dies ist von entscheidender Bedeutung, da der Benutzer Daten verstehen und Erkenntnisse gewinnen kann. Jede Variable in der Analyse wird vom Paket gescannt und analysiert. Darüber hinaus bietet das Paket Funktionen zur Visualisierung dieser Variablen unter Verwendung typischer grafischer Techniken. Es bietet auch allgemeine Datenverarbeitungsverfahren zum Behandeln und Formatieren von Daten.

4. Modelle

Das gmodels-Paket bietet verschiedene Tools in R zum Zeichnen von Daten. Es enthält verschiedene Funktionen wie glh.test, mit denen eine allgemeine lineare Hypothese für ein Regressionsmodell getestet, gedruckt oder zusammengefasst wird. Die Funktion macht. Kontraste wandeln von Menschen lesbare Kontraste in die Form um, die R für die Berechnung benötigt. Die von make.contrasts zurückgegebene Matrix kann als Argument für das Kontrastargument von Modellfunktionen verwendet werden. Die Funktion coefFrame passt ein Modell an jede von definierte Untergruppe an und gibt dann einen Datenrahmen mit einer Zeile für jede Anpassung und einer Spalte für jeden Parameter zurück. Die schätzbare Funktion berechnet und testet Kontraste und andere schätzbare lineare Funktionen von Modellkoeffizienten für lm, glm usw. Die Funktion fit.contrast berechnet und testet beliebige Kontraste für Regressionsobjekte.

5. Grundstücke

Dieses Paket bietet Visualisierungsfunktionen über vielfältige Programmiertools. Die Funktionen im Paket arbeiten mit dem Konzept der Berechnung und des Zeichnens. Die grafischen Möglichkeiten des Pakets werden durch verschiedene Funktionen demonstriert, wie z. B. Bandplot, Boxplot2, Col2hex, Ci2D, Hist2D, Textplot, Sinkplot, Ballonpilot, PlotCI, Plotmittel usw. Diese Funktionen ermöglichen das Arbeiten mit Einstellungen in Bezug auf Farbe, Text und andere komplizierte grafische Aspekte der Visualisierung. Sie befassen sich auch mit komplexen Elementen der statistischen Visualisierung, z. B. lmplot2, Residplot-Funktionen, mit denen der Benutzer eine detaillierte Regressionsdiagnose über Diagnoseplots durchführen kann. Wenn mehrere Daten in derselben Region, jedoch mit getrennten Achsen, gezeichnet werden müssen, ist dies mithilfe der Überzeichnungsfunktion im Paket möglich.

6. Ggplot2

Es ist eines der bekanntesten Pakete in R, das umfangreiche visuelle Möglichkeiten bietet und die Ergebnisse auch komplexer statistischer und mathematischer Techniken präsentiert. Die zahlreichen Funktionen des Pakets ermöglichen es dem Analysten, auf interaktivste Weise Erkenntnisse aus Daten zu gewinnen. Die R-Beschreibung für die Funktion ist „ein System zum deklarativen Erstellen von Grafiken, das auf der Grammatik der Grafiken basiert“. Diese Grafikgrammatik bedeutet, dass der Benutzer 'ggplot2' mitteilen muss, wie Variablen der Ästhetik zugeordnet werden müssen. Dies bedeutet im Wesentlichen, dass festgelegt wird, welche grafischen Aspekte verwendet werden sollen, und dass ggplot2 basierend auf den Details entsprechend funktioniert.

7. Lubridat

Dieses R-Paket erleichtert das Arbeiten mit Datum und Uhrzeit. Das Lubridate-Paket ermöglicht die einfache Bearbeitung von Datums- und Zeitdaten. Es analysiert eine Zahl und bietet eine geeignete Datenanordnung. Tatsächlich verarbeiten die Analysefunktionen im Paket eine Vielzahl von Formaten und Trennzeichen, die den Analyseprozess vereinfachen. Eines der bemerkenswerten Merkmale ist, dass das Paket Funktionen zum Verarbeiten von Daten mit unterschiedlichen Zeitzonen bietet.

8. Hmisc

Das Hmisc-Paket mit dem Namen Harrell Miscellaneous enthält viele Funktionen, die für die Datenanalyse, Grafiken auf höchster Ebene und für Utility-Vorgänge genutzt werden können. Es enthält auch Funktionen zur Berechnung von Stichprobengröße und -stärke, zum Importieren und Kommentieren von Datensätzen, zur Eingabe fehlender Werte, zur Bereitstellung erweiterter Tabellenfunktionen, zum Clustering von Variablen, zur Manipulation der Zeichenfolge, zur Konvertierung von R-Objekten in HTML-Code usw.

9. Gitter

Das Paket bietet ein hochwertiges Datenvisualisierungssystem, das von Trellis-Grafiken inspiriert wurde. Der Schwerpunkt liegt auf multivariaten Daten. Die leistungsstarken Visualisierungsfunktionen des Pakets bieten die erforderliche grafische Lösung. Einige der bemerkenswerten Funktionen im Paket sind B_07_cloud, mit deren Hilfe 3D-Streudiagramme und Drahtmodell-Oberflächendiagramme erstellt werden können. D_level. Farben, eine Funktion zur Berechnung von Falschfarben, die numerische oder kategoriale Variablen darstellen; B_06_levelplot, eine Funktion, die Ebenendiagramme und Konturendiagramme generiert; A_01_Lattice, eine Funktion, die gittergrafische Funktionen bereitstellt. B_09_tmd ist eine Funktion, die einen Tukey-Mittelwert-Differenz-Plot erzeugt. B_11_oneway, eine Funktion, die zum Einwegmodell passt. Das Paket bietet somit umfangreiche Funktionalitäten zur Visualisierung durch verschiedene Funktionen.

10. MatrixModels

Dieses Paket ermöglicht die Modellierung mit spärlichen und dichten 'Matrix'-Matrizen. Um dies zu erreichen, werden modulare Vorhersage- und Antwortmodule verwendet. Alle vom Paket bereitgestellten Funktionen sind gleich wichtig, einige davon sind lm.fit.sparse, eine Anpassungsfunktion für spärliche lineare Modelle, solveCoef, die nach den Koeffizienten und dem Koeffizienteninkrementmodell auflöst. Eine Matrix, die möglicherweise spärliche Design- oder Modellmatrizen konstruiert, glm4, die für verallgemeinerte lineare Modelle geeignet ist.

11. Multcomp

Das Paket ermöglicht mehrere Vergleiche von k Gruppen in verallgemeinerten linearen Modellen. Eine Liste von neun Standardverfahren, nämlich. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott und Tetrade werden dem Benutzer zur Verfügung gestellt, und der Benutzer wählt die Vergleiche basierend auf der Anforderung aus. Darüber hinaus steht für die Kontrastmatrix eine freie Eingabeschnittstelle zur Verfügung, die spezielle Vergleiche ermöglicht. Das bemerkenswerte Merkmal ist, dass die Vergleiche selbst nicht auf ein bestimmtes Design wie ausgewogen oder einfach beschränkt sind, sondern die Programme so gestaltet sind, dass sie mehreren Vergleichen innerhalb des allgemeinen linearen Modells entsprechen, die Kovariaten, korrelierte Mittelwerte und fehlende Werte zulassen, etc.

12. OpenMx

Dieses Paket befasst sich im Wesentlichen mit der erweiterten Modellierung von Strukturgleichungen. Es bietet Funktionalitäten zur Erstellung von Strukturgleichungsmodellen. Diese Modelle können über die Programmierung manipuliert werden. Die Modelle können mit Matrizen oder Pfaden wie LISREL oder RAM spezifiziert werden. Einige der Modelltypen umfassen mehrere Gruppen, Bestätigungsfaktor, Mischungsverteilung, kategoriale Schwelle, Differential-Fit-Funktionen usw.

13. Plyr

Es ist ein sehr wichtiges Paket, das Funktionen für die Datenmanipulation bereitstellt. Es bietet Tools zum Teilen, Anwenden und Kombinieren von Daten. Es wird mit einer Reihe von Tools geliefert, mit denen sich häufig auftretende Probleme lösen lassen. Zum Beispiel müssen wir manchmal eine große Aufgabe in kleinere Aufgaben aufteilen, die handhabbar sind, dann arbeiten wir an jedem der Teile und setzen schließlich alle Teile wieder zusammen.

14. Qcc

Das Paket gewinnt aufgrund der verschiedenen Funktionen zur Qualitätsanalyse an Bedeutung. Es bietet Shewhart-Qualitätskontrolldiagramme für kontinuierliche Daten, Attribute und Zähldaten. Weitere wichtige Diagramme sind Cusum- und EWMA-Diagramme sowie Betriebskennlinien. Es bietet auch Funktionen zur Analyse der Prozessfähigkeit. Pareto-Diagramm, Ursache-Wirkungs-Diagramm und multivariate Steuerungsdiagramme sind nützliche Tools, die im Paket enthalten sind.

15. RandomForest

Wie der Name schon sagt, wird dieses Paket verwendet, um einen zufälligen Gesamtstrukturalgorithmus zu erstellen. Das Paket implementiert den Zufallsforst-Algorithmus von Breiman, der auf dem ursprünglichen FORTRAN-Code von Beiman und Cutler basiert. Der Algorithmus wird zur Klassifizierung und Regression verwendet. Das Paket kann auch unbeaufsichtigt verwendet werden, um Ähnlichkeiten zwischen Datenpunkten zu bewerten.

16. Psych

Es ist ein Paket, das für einen bestimmten Zweck bestimmt ist. Das Paket enthält ein Verfahren für die psychologische, psychometrische und Persönlichkeitsforschung. Funktionen dienen in erster Linie der multivariaten Analyse unter Verwendung verschiedener multivariater statistischer Techniken.

Fazit-Liste der R-Pakete

Es gibt zahlreiche Pakete in R, und die Anwendung eines Pakets hängt von den Anforderungen ab. Die Community der Liste der R-Pakete ist sehr schnell gewachsen, und jeden Tag wird ein Paket hinzugefügt. Mehrere Pakete bieten möglicherweise ähnliche Funktionen, die Auswahl eines Pakets muss jedoch auf einer sorgfältigen Untersuchung beruhen.

Empfohlene Artikel

Dies ist eine Anleitung zu einer Liste von R-Paketen. Hier diskutieren wir die Einführung in R-Pakete und einige wichtige Pakete von R. Sie können auch unsere anderen vorgeschlagenen Artikel durchgehen, um mehr zu erfahren -

  1. Java-Pakete
  2. Was ist JNDI in Java?
  3. JColorChooser
  4. R Programmieren gegen Python

Kategorie: