Einführung in die R-String-Funktionen

R-Sprache oder R-String-Funktionen werden hauptsächlich für die grafische Darstellung der Daten, die statistische Analyse der Daten und die Berichterstellung verwendet. Es ist eine Open-Source-Sprache. Die Namenskonvention dieser Sprache wurde aus den Anfangsbuchstaben der Gründer dieser Sprache abgeleitet, nämlich Ross Ihaka und Robert Gentleman. Es ist eine interpretierte Programmiersprache. Es kann in verschiedene andere Sprachprozeduren wie C ++, Python usw. integriert werden. Derzeit ist R die weltweit am häufigsten verwendete Programmiersprache.

Merkmale der R-String-Funktionen

Die Hauptmerkmale der R-Sprache sind wie folgt:

  • Eine fein entwickelte und sehr einfache statistische Sprache.
  • Speicherung und Datenhandhabung sind sehr effizient in R eingebettet.
  • Es bietet eine große Anzahl klassifizierter Tools, die bei der Datenanalyse helfen
  • R bietet auch Bibliotheken, um grafische Darstellungen der Daten zu erhalten

R String-Funktionen Manipulation

Nachfolgend finden Sie eine Liste der R-String-Manipulationsfunktionen.

1. Grep () in R-String-Funktionen

Wird verwendet, um ein Muster in den Daten abzugleichen und das Muster durch eine andere Zeichenfolge zu ersetzen. Die grep-Funktion kann in R-Sprachen auf verschiedene Arten ausgedrückt werden: regexpr, gregexpr grep, grepl und regexec.

Beispiel: grep (Muster, x, ignorieren. Fall = FALSE, Perl = FALSE, Wert = FALSE, fest = FALSE, verwenden Sie Bytes = FALSE, invert = FALSE)

Argumente:

  • Muster - Zeichenkette, die einen üblichen Ausdruck enthält, der dem angegebenen Zeichenvektor entsprechen soll.
  • X, Text - Ein Objekt, das als Zeichen auf einen Zeichenvektor beschränkt werden kann.
  • Ignorieren. Groß- / Kleinschreibung (False - Pattern Matching berücksichtigt die Groß- / Kleinschreibung, True - Pattern Matching berücksichtigt die Groß- / Kleinschreibung)
  • Perl - Um Perl-kompatible Ausdrücke zu bestimmen, werden speziell reguläre Ausdrücke verwendet.
  • Wert - Wenn eine Übereinstimmung gefunden wird, wird true zurückgegeben, andernfalls false.
  • Use Bytes (Bytes verwenden) - Wenn danach TRUE ( WAHR), erfolgt der Abgleich byteweise anstelle von zeichenweise.
  • Invertieren - Gibt Indizes zurück, wenn True,
  • Replacement - Die Ersatzzeichenfolge,

2. Nchar ()

Wird verwendet, um die Anzahl der Zeichen in einem Vektor zu zählen. Nimmt einen Vektor im Zeichenfolgenformat als Argument und gibt einen anderen numerischen Vektor zurück, der die Anzahl der Zeichenfolgen enthält.

Beispiel: nchar (x, type = "chars", allowNA = FALSE, keepNA = NA)

Argumente:

  • X - Vektorzeichenfolge.
  • Type (Typ) - Typ der Zeichenfolge, die die drei häufigsten genannten Zeichen enthält ("Bytes", "Zeichen", "Breite").
  • AllowNA - Gibt an, ob "Nicht zutreffend" als Ausgabe zurückgegeben werden kann.
  • KeepNA - Sollte "Nicht zutreffend" zurückgegeben werden, wenn X nicht gefunden wird.

3.Substr ()

Dient zum Auswählen des Teilzeichenfolgenwerts des Zeichenvektors.

Beispiel: substr (x, start, stop)

Argumente:

  • X, Text - Die Vektor Charterer Zeichenfolge.
  • Start, First - Ganzzahl. Start des Elements, das ersetzt werden soll
  • Stop, Last - Ganzzahl. Hier erfolgt der Austausch am Ende der Zeichenkette

4. strsplit () in R-String-Funktionen

Wird zum Teilen einer vorhandenen Vektorzeichenfolge in mehrere Teilzeichenfolgen entsprechend den darin gefundenen Teilzeichenfolgen-Übereinstimmungen verwendet

Beispiel: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

Argumente:

  • X - Zeichenvektor, der gespuckt werden soll.
  • Split - Zeichenvektor, der als Trennzeichen fungiert.
  • Behoben - Macht eine gleiche Aufteilung, wenn sie als wahr übergeben wird
  • Perl - Sollten Perl-kompatible reguläre Ausdrücke verwendet werden?
  • UseBytes - Wenn es als true übergeben wird, wird eine Byte-für-Byte-Übereinstimmung anstelle einer Zeichen-für-Zeichen-Übereinstimmung ausgelöst

5. Regexpr ()

Mehr als grep gibt der reguläre Ausdruck den Index an, an dem eine gültige Übereinstimmung beginnt, und die Länge der übereinstimmenden Zeichenfolge, wenn keine Übereinstimmung gefunden wird, wird der Wert -1 zurückgegeben.

Beispiel: regexpr (Muster, Text, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

Argumente:

  • Muster - Zeichenkette, die einen üblichen Ausdruck enthält, der dem angegebenen Zeichenvektor entsprechen soll.
  • X - Zeichenvektor
  • Ignore.case - (False - Pattern Matching unterscheidet zwischen Groß- und Kleinschreibung, True - Patter Matching unterscheidet zwischen Groß- und Kleinschreibung)
  • Perl - Um Perl-kompatible Ausdrücke zu bestimmen, werden speziell reguläre Ausdrücke verwendet
  • Wert - Wenn eine Übereinstimmung gefunden wird, wird true zurückgegeben, andernfalls false
  • UseBytes - Wenn danach TRUE, erfolgt der Abgleich byteweise statt zeichenweise .
  • Invertieren - Gibt Indizes zurück, wenn True

6. Gregexpr () in R-String-Funktionen

Die Angabe von gregexpr gibt eine Liste mit einer ähnlichen Länge wie ein Text zurück, dessen Element eine ähnliche Form wie der Rückgabewert für regexpr hat, mit der Ausnahme, dass die vorläufigen Positionen jeder (disjunkten) Übereinstimmung angegeben werden.

Syntax: gregexpr (Muster, Text, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE, extract = FALSE)

Argumente:

  • Muster - Zeichenkette, die einen üblichen Ausdruck enthält, der dem angegebenen Zeichenvektor entsprechen soll.
  • X - Zeichenvektor
  • Ignore.case - (False - Bei der Mustererkennung wird zwischen Groß- und Kleinschreibung unterschieden. True - Bei der Mustererkennung wird zwischen Groß- und Kleinschreibung unterschieden.)
  • Perl - Um Perl-kompatible Ausdrücke zu bestimmen, werden speziell reguläre Ausdrücke verwendet
  • Wert - Wenn eine Übereinstimmung gefunden wird, wird true zurückgegeben, andernfalls false
  • UseBytes - Wenn danach TRUE, erfolgt der Abgleich byteweise statt zeichenweise .
  • Invertieren - Gibt Indizes zurück, wenn True
  • Extract - Wenn eine logische Angabe übereinstimmt, wird ein Extrakt der Teilzeichenfolge erstellt und zurückgegeben

7. Regexec ()

Das regexec () in R String Functions ist dem regexpr () sehr ähnlich, außer dass hier die Indizes in Klammern der entsprechenden Unterausdrücke zurückgegeben werden

Syntax: regexec (Muster, Text, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

Argumente:

  • Muster - Zeichenkette, die einen üblichen Ausdruck enthält, der dem angegebenen Zeichenvektor entsprechen soll.
  • X - Zeichenvektor
  • Ignore.case - (False - Pattern Matching unterscheidet zwischen Groß- und Kleinschreibung, True - Patter Matching unterscheidet zwischen Groß- und Kleinschreibung)
  • Perl - Um Perl-kompatible Ausdrücke zu bestimmen, werden speziell reguläre Ausdrücke verwendet
  • Wert - Wenn eine Übereinstimmung gefunden wird, wird true zurückgegeben, andernfalls false
  • UseBytes - Wenn danach TRUE, erfolgt der Abgleich byteweise statt zeichenweise .
  • Invertieren - Gibt Indizes zurück, wenn True

Empfohlene Artikel

Dies war ein Leitfaden für R-String-Funktionen. Hier haben wir das Konzept, die Eigenschaften, die Manipulation von R-String-Funktionen mit Beispielen und Argumenten besprochen. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. JavaScript-String-Funktionen
  2. Oracle String-Funktionen
  3. T-SQL-Zeichenfolgenfunktionen
  4. VBScript-String-Funktionen
  5. Regex-Funktionen in Python (Beispiel)