Einführung in die Hive-String-Funktion

Die Zeichenfolge ist eine Folge von Zeichen. In Hive werden Zeichenfolgenfunktionen verwendet, um verschiedene Vorgänge auszuführen, z. B. das Umkehren von Zeichenfolgen, das Konvertieren in Groß- und Kleinbuchstaben, das Entfernen von Leerzeichen usw. Hive-Zeichenfolgenfunktionen ähneln SQL-Zeichenfolgenfunktionen. Schauen wir uns diese Zeichenfolgenfunktionen im Detail an, um das Konzept leicht zu verstehen.

Hive-String-Funktionen

Im Folgenden finden Sie einige Hive-String-Funktionen mit einigen Beispielen.

1. Wiederholen

Diese Hive-String-Funktion wird verwendet, um einen bestimmten String mit einer Häufigkeit von N zu wiederholen.

Syntax:

Repeat(string str, n);

z.B:

Repeat('Apple', 3);

Ausgabe: Apple Apple Apple

2. Umkehren

Diese Umkehrfunktion kehrt die angegebene Zeichenfolge um und gibt das unten gezeigte Ergebnis aus.

Syntax:

Reverse(string str);

Z.B:

ReverseE('Apple');

Ausgabe: elppA

3. Trimmen

Diese Trim-Funktion wird verwendet, um alle Leerzeichen aus der Zeichenfolge zu entfernen und eine neue Zeichenfolge ohne Leerzeichen zu erstellen.

Syntax:

Trim(string str);

Z.B:

Trim('Apple');

Ausgabe:

Apfel

4. Rtrim

Diese Rtrim-Funktion wird verwendet, um alle Leerzeichen auf der rechten Seite der Zeichenfolge zu entfernen und eine neue Zeichenfolge zu erstellen.

Syntax:

RTRIM(string str);

Z.B:

RTRIM('Apple');

Ausgabe:

Apfel

5. LTRIM

Diese LTRIM-Funktion wird verwendet, um alle Leerzeichen auf der linken Seite der Zeichenfolge zu entfernen und eine neue Zeichenfolge zu erstellen.

Syntax:

LTRIM(stringstr);

Z.B:

LTRIM('Apple');

Ausgabe:

Apfel

6. LOWER oder LCASE

Diese Zeichenfolgenfunktion wird verwendet, um alle Zeichen der angegebenen Zeichenfolge in Kleinbuchstaben umzuwandeln.

Syntax:

LOWER(string str);or LCASE(string str);

Z.B:

LOWER('ApPle'); or LCASE('ApPle');

Ausgabe:

Apfel

7. OBERE oder UCASE

Diese UPPER-Funktion wird verwendet, um alle Zeichen der angegebenen Zeichenfolge in Großbuchstaben umzuwandeln.

Syntax:

UPPER(string str);or UCASE(string str);

Z.B:

UPPER('apple'); or UCASE('apple');

Ausgabe:

APFEL

8. CONCAT

Alle Strings sind in die CONCAT-Funktion integriert.

Syntax:

CONCAT(stringstr1, stringstr2, stringstr3….)

Z.B:

CONCAT( 'Apple', '-', 'eat' );

Ausgabe:

"Apfel essen"

9. CONCAT_WS

CONCAT-Funktion und CONCAT_WS-Funktion haben beide die gleichen Eigenschaften. In dieser CONCAT_WS-Funktion können Sie ein Trennzeichen angeben, das zwischen den Zeichenfolgen für CONCAT verwendet werden kann

Z.B:

CONCAT_WS( '-', 'apple', 'eat' );

Ausgabe:

"Apfel essen"

10. LÄNGE

Diese LENGTH-Funktion wird verwendet, um die Anzahl der Zeichen abzurufen, die in der angegebenen Zeichenfolge vorhanden sind.

Syntax:

LENGTH(string str);

Z.B:

LENGTH( 'Apple' );

Ausgabe:

5

11. SPACE

Diese SPACE-Funktion wird verwendet, um die angegebene Anzahl von Leerzeichen in Zeichenfolgen anzugeben

Syntax:

SPACE(intnum_of_spaces);

Z.B:

SPACE(5);

Ausgabe:

''

12. SPLIT

Die Funktion SPLIT teilt die Zeichenfolge um das Mustermuster auf und gibt ein Array von Zeichenfolgen zurück. Sie können reguläre Ausdrücke als Muster angeben.

Syntax:

SPLIT(string str, string pat)

Beispiel:

SPLIT('hive:Hadoop', ':'

Ausgabe:

("Bienenstock", "Hadoop")

13. LPAD

Die LPAD-Funktion wird verwendet, um den String mit einer Länge von Zeilenzeichen zu versehen, die mit einem Füllzeichen links aufgefüllt sind.

Syntax:

LPAD(string str, int len, string pad)

Z.B:

LPAD ("Hadoop", 8, "H");

Ausgabe:

hhhadoop

14. RPAD

Die RPAD-Funktion wird verwendet, um der Zeichenfolge eine Länge von len Zeichen zu geben, die mit einem Pad-Zeichen rechts aufgefüllt ist.

Syntax:

RPAD(string str, int len, string pad)

Ausgabe:

Hadooppp

15. INSTRING

Diese Funktion wird verwendet, um die Position des ersten Auftretens eines Teilstrings in str anzugeben. Wenn eines der Argumente der Zeichenfolge null ist, wird NULL als Ausgabe ausgegeben. Fehlt ein Unterzeichen oder kann es in str nicht gefunden werden, wird 0 zurückgegeben. Der Indexwert des ersten Zeichens in str ist 1.

Syntax:

INSTR(string str, string substring);

z.B:

INSTR('Rachel', 'el');

Ausgabe:

4

16. Lokalisieren

Diese Funktion wird verwendet, um die Position des ersten Auftretens eines Teilstrings in der Zeichenfolge nach der Position pos anzugeben.

Syntax:

LOCATE(string substring, string str(, int pos));

z.B

LOCATE('el', 'Rachel', 2);

Ausgabe:

4

17. Übersetzen

Diese Funktion wird verwendet, um die Zeichen einer bestimmten Zeichenfolge mit den entsprechenden Zeichen zu übersetzen, die in der to-Zeichenfolge angegeben sind. Wenn ein Argument in einer bestimmten Zeichenfolge NULL ist, wird NULL als Ausgabe ausgegeben.

Syntax:

TRANSLATE(string|char|varchar input, string|char|varchar from, string|char|varchar to);

z.B:

TRANSLATE('Make sure u knew that code', 'e', 'o');

Ausgabe:

Mako, du kennst das Codo

18. ASCII (string str);

Die ASCII-Funktion wird verwendet, um den ASCII-Wert des ersten Zeichens einer bestimmten Zeichenfolge anzugeben.

Beispiel 1:

ASCII('hadoop') ;

Ausgabe:

104

Beispiel2:

ASCII('A') ;

Ausgabe:

65

19. PRINTF

Gibt das Eingabeformat gemäß den PRINTF-Formatzeichenfolgen zurück.

Syntax:

PRINTF(Obj…args);

20. regxp_replace

Syntax:

regxp_replace(string A, string B, String C)

Diese Funktion gibt die Zeichenfolge zurück, die die Ausgabe des Ersetzens aller Teilzeichenfolgen in B ist, die der regulären Java-Syntax mit C entsprechen.

21. From_unix-Zeit

Syntax:

from_unixtime(int Unix time)

Diese Funktion konvertiert die Anzahl der Sekunden aus der Unix-Epoche in eine Zeichenfolge, die den Zeitstempel der aktuellen Systemzeitzone darstellt. Ein Zeitstempel hat beispielsweise das folgende Format (2019-01-01 00:00:00 UTC). Diese Funktion konvertiert ihn dann in das Format „2019-01-01 00:00:00“.

Z.B:

from_unixtime(int 2011-01-06 12:00:00 UTC)

Ausgabe:

2011-01-06 12:00:00

22. get_json_object

Syntax:

get_json_object(string json_string, string path)

Basierend auf dem angegebenen JSON-Pfad extrahiert diese Funktion das JSON-Objekt aus einer JSON-Zeichenfolge und gibt eine JSON-Zeichenfolge des extrahierten JSON-Objekts zurück. Wenn JSON-Zeichenfolgen ungültig sind, wird NULL zurückgegeben.

23. To_Date

Syntax:

to_date(string timestamp)

Diese Funktion gibt den Datumsteil einer Zeitstempelzeichenfolge zurück.

z.B:

to_date("2019-03-04 00:04:12)

Ausgabe:

2019-03-04

Empfohlene Artikel

Dies war eine Anleitung zu Hive-String-Funktionen. Hier haben wir das Konzept und verschiedene in Hive verwendete String-Funktionen besprochen. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. PostgreSQL-String-Funktionen
  2. Fragen im Vorstellungsgespräch bei Hive
  3. JavaScript-String-Funktionen
  4. Beispiele für VB.Net-Zeichenfolgenfunktionen
  5. Verwendung von VBScript-Zeichenfolgenfunktionen
  6. Komponenten der Hive-Architektur
  7. Hive Order By
  8. Hive-Installation

Kategorie: