Einführung in die Hive-String-Funktion
Die Zeichenfolge ist eine Folge von Zeichen. In Hive werden Zeichenfolgenfunktionen verwendet, um verschiedene Vorgänge auszuführen, z. B. das Umkehren von Zeichenfolgen, das Konvertieren in Groß- und Kleinbuchstaben, das Entfernen von Leerzeichen usw. Hive-Zeichenfolgenfunktionen ähneln SQL-Zeichenfolgenfunktionen. Schauen wir uns diese Zeichenfolgenfunktionen im Detail an, um das Konzept leicht zu verstehen.
Hive-String-Funktionen
Im Folgenden finden Sie einige Hive-String-Funktionen mit einigen Beispielen.
1. Wiederholen
Diese Hive-String-Funktion wird verwendet, um einen bestimmten String mit einer Häufigkeit von N zu wiederholen.
Syntax:
Repeat(string str, n);
z.B:
Repeat('Apple', 3);
Ausgabe: Apple Apple Apple
2. Umkehren
Diese Umkehrfunktion kehrt die angegebene Zeichenfolge um und gibt das unten gezeigte Ergebnis aus.
Syntax:
Reverse(string str);
Z.B:
ReverseE('Apple');
Ausgabe: elppA
3. Trimmen
Diese Trim-Funktion wird verwendet, um alle Leerzeichen aus der Zeichenfolge zu entfernen und eine neue Zeichenfolge ohne Leerzeichen zu erstellen.
Syntax:
Trim(string str);
Z.B:
Trim('Apple');
Ausgabe:
Apfel
4. Rtrim
Diese Rtrim-Funktion wird verwendet, um alle Leerzeichen auf der rechten Seite der Zeichenfolge zu entfernen und eine neue Zeichenfolge zu erstellen.
Syntax:
RTRIM(string str);
Z.B:
RTRIM('Apple');
Ausgabe:
Apfel
5. LTRIM
Diese LTRIM-Funktion wird verwendet, um alle Leerzeichen auf der linken Seite der Zeichenfolge zu entfernen und eine neue Zeichenfolge zu erstellen.
Syntax:
LTRIM(stringstr);
Z.B:
LTRIM('Apple');
Ausgabe:
Apfel
6. LOWER oder LCASE
Diese Zeichenfolgenfunktion wird verwendet, um alle Zeichen der angegebenen Zeichenfolge in Kleinbuchstaben umzuwandeln.
Syntax:
LOWER(string str);or LCASE(string str);
Z.B:
LOWER('ApPle'); or LCASE('ApPle');
Ausgabe:
Apfel
7. OBERE oder UCASE
Diese UPPER-Funktion wird verwendet, um alle Zeichen der angegebenen Zeichenfolge in Großbuchstaben umzuwandeln.
Syntax:
UPPER(string str);or UCASE(string str);
Z.B:
UPPER('apple'); or UCASE('apple');
Ausgabe:
APFEL
8. CONCAT
Alle Strings sind in die CONCAT-Funktion integriert.
Syntax:
CONCAT(stringstr1, stringstr2, stringstr3….)
Z.B:
CONCAT( 'Apple', '-', 'eat' );
Ausgabe:
"Apfel essen"
9. CONCAT_WS
CONCAT-Funktion und CONCAT_WS-Funktion haben beide die gleichen Eigenschaften. In dieser CONCAT_WS-Funktion können Sie ein Trennzeichen angeben, das zwischen den Zeichenfolgen für CONCAT verwendet werden kann
Z.B:
CONCAT_WS( '-', 'apple', 'eat' );
Ausgabe:
"Apfel essen"
10. LÄNGE
Diese LENGTH-Funktion wird verwendet, um die Anzahl der Zeichen abzurufen, die in der angegebenen Zeichenfolge vorhanden sind.
Syntax:
LENGTH(string str);
Z.B:
LENGTH( 'Apple' );
Ausgabe:
5
11. SPACE
Diese SPACE-Funktion wird verwendet, um die angegebene Anzahl von Leerzeichen in Zeichenfolgen anzugeben
Syntax:
SPACE(intnum_of_spaces);
Z.B:
SPACE(5);
Ausgabe:
''
12. SPLIT
Die Funktion SPLIT teilt die Zeichenfolge um das Mustermuster auf und gibt ein Array von Zeichenfolgen zurück. Sie können reguläre Ausdrücke als Muster angeben.
Syntax:
SPLIT(string str, string pat)
Beispiel:
SPLIT('hive:Hadoop', ':'
Ausgabe:
("Bienenstock", "Hadoop")13. LPAD
Die LPAD-Funktion wird verwendet, um den String mit einer Länge von Zeilenzeichen zu versehen, die mit einem Füllzeichen links aufgefüllt sind.
Syntax:
LPAD(string str, int len, string pad)
Z.B:
LPAD ("Hadoop", 8, "H");
Ausgabe:
hhhadoop
14. RPAD
Die RPAD-Funktion wird verwendet, um der Zeichenfolge eine Länge von len Zeichen zu geben, die mit einem Pad-Zeichen rechts aufgefüllt ist.
Syntax:
RPAD(string str, int len, string pad)
Ausgabe:
Hadooppp
15. INSTRING
Diese Funktion wird verwendet, um die Position des ersten Auftretens eines Teilstrings in str anzugeben. Wenn eines der Argumente der Zeichenfolge null ist, wird NULL als Ausgabe ausgegeben. Fehlt ein Unterzeichen oder kann es in str nicht gefunden werden, wird 0 zurückgegeben. Der Indexwert des ersten Zeichens in str ist 1.
Syntax:
INSTR(string str, string substring);
z.B:
INSTR('Rachel', 'el');
Ausgabe:
4
16. Lokalisieren
Diese Funktion wird verwendet, um die Position des ersten Auftretens eines Teilstrings in der Zeichenfolge nach der Position pos anzugeben.
Syntax:
LOCATE(string substring, string str(, int pos));
z.B
LOCATE('el', 'Rachel', 2);
Ausgabe:
4
17. Übersetzen
Diese Funktion wird verwendet, um die Zeichen einer bestimmten Zeichenfolge mit den entsprechenden Zeichen zu übersetzen, die in der to-Zeichenfolge angegeben sind. Wenn ein Argument in einer bestimmten Zeichenfolge NULL ist, wird NULL als Ausgabe ausgegeben.
Syntax:
TRANSLATE(string|char|varchar input, string|char|varchar from, string|char|varchar to);
z.B:
TRANSLATE('Make sure u knew that code', 'e', 'o');
Ausgabe:
Mako, du kennst das Codo
18. ASCII (string str);
Die ASCII-Funktion wird verwendet, um den ASCII-Wert des ersten Zeichens einer bestimmten Zeichenfolge anzugeben.
Beispiel 1:
ASCII('hadoop') ;
Ausgabe:
104
Beispiel2:
ASCII('A') ;
Ausgabe:
65
19. PRINTF
Gibt das Eingabeformat gemäß den PRINTF-Formatzeichenfolgen zurück.
Syntax:
PRINTF(Obj…args);
20. regxp_replace
Syntax:
regxp_replace(string A, string B, String C)
Diese Funktion gibt die Zeichenfolge zurück, die die Ausgabe des Ersetzens aller Teilzeichenfolgen in B ist, die der regulären Java-Syntax mit C entsprechen.
21. From_unix-Zeit
Syntax:
from_unixtime(int Unix time)
Diese Funktion konvertiert die Anzahl der Sekunden aus der Unix-Epoche in eine Zeichenfolge, die den Zeitstempel der aktuellen Systemzeitzone darstellt. Ein Zeitstempel hat beispielsweise das folgende Format (2019-01-01 00:00:00 UTC). Diese Funktion konvertiert ihn dann in das Format „2019-01-01 00:00:00“.
Z.B:
from_unixtime(int 2011-01-06 12:00:00 UTC)
Ausgabe:
2011-01-06 12:00:00
22. get_json_object
Syntax:
get_json_object(string json_string, string path)
Basierend auf dem angegebenen JSON-Pfad extrahiert diese Funktion das JSON-Objekt aus einer JSON-Zeichenfolge und gibt eine JSON-Zeichenfolge des extrahierten JSON-Objekts zurück. Wenn JSON-Zeichenfolgen ungültig sind, wird NULL zurückgegeben.
23. To_Date
Syntax:
to_date(string timestamp)
Diese Funktion gibt den Datumsteil einer Zeitstempelzeichenfolge zurück.
z.B:
to_date("2019-03-04 00:04:12)
Ausgabe:
2019-03-04
Empfohlene Artikel
Dies war eine Anleitung zu Hive-String-Funktionen. Hier haben wir das Konzept und verschiedene in Hive verwendete String-Funktionen besprochen. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -
- PostgreSQL-String-Funktionen
- Fragen im Vorstellungsgespräch bei Hive
- JavaScript-String-Funktionen
- Beispiele für VB.Net-Zeichenfolgenfunktionen
- Verwendung von VBScript-Zeichenfolgenfunktionen
- Komponenten der Hive-Architektur
- Hive Order By
- Hive-Installation