Einführung in Hive Order By

Hive ist eine Data Warehousing-Einrichtung von Apache. Hive basiert auf dem Hadoop Distributed File System (HDFS) zum Schreiben, Lesen, Abfragen und Verwalten großer strukturierter oder semi-strukturierter Daten in verteilten Speichersystemen wie HDFS. Jedes HiveQL wird im Backend in einen MapReduce-Job konvertiert. Hive bietet Hive Query Language (HiveQL), die dem normalen SQL in RDBMS ähnelt. Wie SQL stellt HiveQL auch die ORDER BY-Klausel bereit, die mit der SELECT-Klausel verwendet werden kann. ORDER BY-Funktion wird verwendet, um Daten in aufsteigender oder absteigender Reihenfolge nach vom Benutzer angegebenen Spalten zu sortieren.

Syntax in Hive Order By

Unten ist die Syntax in Hive-Reihenfolge von:

Grundlegende Syntax:

SELECT, FROM ORDER BY ;

SELECT, FROM ORDER BY ;

ORDER BY-Klausel zusammen mit allen anderen Klauseln:

SELECT DISTINCT, , FROM WHERE GROUP BY HAVING ORDER BY LIMIT ;

SELECT DISTINCT, , FROM WHERE GROUP BY HAVING ORDER BY LIMIT ;

Sie können auch ORDER BY 1 oder ORDER BY 2 angeben, wobei 1 und 2 die Spaltennummer darstellen, anstatt ORDER BY zu verwenden. ORDER BY kann nur verwendet werden, wenn Spaltennamen in der SELECT-Klausel und nicht in der SELECT * -Klausel angegeben sind.

Wie können wir die ORDER BY-Funktion in Hive verwenden?

Die folgende Erklärung zeigt, wie wir die Reihenfolge nach Funktion in einem Bienenstock verwenden können:

1. ORDER BY Ascending und Descending

  • Standardmäßig ist die Sortierreihenfolge aufsteigend, wobei der kleinste Wert am Anfang und der größte Wert am Ende des Ergebnisses angezeigt wird, auch wenn Sie ihn nicht explizit angeben.
  • Sie können auch ORDER BY ASC für aufsteigende Reihenfolge und ORDER BY DESC für die Sortierung des Ergebnisses in absteigender Reihenfolge oder in der angegebenen Spalte angeben.
  • Die HiveQL-Syntax für ODER BY in aufsteigender Reihenfolge kann wie folgt angezeigt werden:

SELECT, FROM ORDER BY ASC;

SELECT, FROM ORDER BY ASC;

  • Die HiveQL-Syntax für ODER BY in absteigender Reihenfolge kann wie folgt dargestellt werden:

SELECT, FROM ORDER BY DESC;

SELECT, FROM ORDER BY DESC;

  • Aufsteigende und absteigende Klauseln können gleichzeitig mit mehreren Spalten in der ORDER BY-Klausel verwendet werden, wie unten gezeigt:

SELECT, FROM ORDER BY ASC DESC;

SELECT, FROM ORDER BY ASC DESC;

2. ORDER BY- und NULL-Werte

  • Die neuesten Versionen von Hive unterstützen auch die Sortierreihenfolge für NULL-Werte.
  • Standardmäßig ist die Sortierreihenfolge der NULL-Werte für ORDER BY ASC NULLS FIRST. Es sortiert alle NULL-Werte an den Anfang des sortierten Ergebnisses.
  • Ebenso ist die Sortierreihenfolge der NULL-Werte für ORDER BY DESC standardmäßig NULL LAST. Es sortiert alle NULL-Werte bis zum Ende des sortierten Ergebnisses.
  • Sie können auch NULLS FIRST und NULLS LAST zusammen mit ORDER BY ASC oder mit ORDER BY DESC angeben, je nach Ihren Anforderungen und Ihrem Komfort.
  • Syntax der NULLS FIRST-Klausel zusammen mit ORDER BY aufsteigend:

SELECT, FROM ORDER BY ASC NULLS LAST;

SELECT, FROM ORDER BY ASC NULLS LAST;

  • Syntax der NULLS LAST-Klausel zusammen mit ORDER BY absteigend:

SELECT, FROM ORDER BY DESC NULLS FIRST;

SELECT, FROM ORDER BY DESC NULLS FIRST;

3. ORDER BY- und LIMIT-Klausel

  • Die LIMIT-Klausel ist in Verbindung mit der ORDER BY-Klausel optional.
  • Die LIMIT-Klausel kann verwendet werden, um die Leistung zu verbessern. Die LIMIT-Klausel kann verwendet werden, um unnötige Datenverarbeitung zu vermeiden.
  • Die LIMIT-Klausel wählt nur die begrenzte Anzahl von Werten aus dem Ergebnis zum Zweck der Überprüfung aus.
  • Die LIMIT-Klausel mit der ORDER By-Klausel kann wie folgt angezeigt werden:

SELECT, FROM ORDER BY ASC LIMIT 10;

SELECT, FROM ORDER BY ASC LIMIT 10;

  • Die ORDER BY-Klausel kann auch mit der OFFSET-Klausel und der LIMIT-Klausel kombiniert werden, um die Menge des Ergebnisses zu verringern. Die Syntax desselben kann wie folgt dargestellt werden:

SELECT, FROM ORDER BY ASC LIMIT 10 OFFSET 10;

SELECT, FROM ORDER BY ASC LIMIT 10 OFFSET 10;

Beispiele in Hive Order By

Betrachten Sie die folgende Beispieltabelle Employee, die Employee Id als EmpID, Employee Name als EmpName, Designation, Department als Dept, Job Level als JL und Salary enthält.

Beispiel 1

Code:

SELECT * FROM Employee ORDER BY JL ASC;

Ausgabe:

Beispiel # 2

Code:

SELECT * FROM Employee ORDER BY Salary DESC LIMIT 3;

Ausgabe:

Beispiel # 3

Code:

SELECT EmpId, EmpName, Designation, Dept FROM Employee where Salary < 50000 ORDER BY EmpName ASC JL ASC;

Ausgabe:

Fazit

ORDER BY in Hive ermöglicht das Sortieren von Daten in aufsteigender oder absteigender Reihenfolge. ORDER BY kann mit anderen Klauseln kombiniert werden, um die sortierten Daten zu erhalten. ORDER BY unterscheidet sich von SORT BY, da SORT BY die Daten innerhalb eines Reduzierers sortiert, ORDER BY jedoch die gesamten Daten sortiert.

Empfohlene Artikel

Dies ist eine Anleitung zu Hive Order By. Hier diskutieren wir, wie wir die Reihenfolge nach Funktionen in einem Hive verwenden können, und verschiedene Beispiele mit Codes und Ausgaben. Sie können auch unsere anderen verwandten Artikel durchgehen, um mehr zu erfahren -

  1. Integrierte Funktionen
  2. Was ist ein Bienenstock?
  3. So installieren Sie Hive
  4. Hive-Funktion
  5. Tableau-Versionen
  6. Hive-Installation
  7. Beispiele für integrierte Python-Funktionen

Kategorie: