Einführung in Hive Drop Table

Das Schlüsselwort "DROP" bezieht sich auf das Löschen. Zum Löschen von Daten müssen Daten im Hive vorhanden sein.

In Hadoop haben wir zwei Funktionalitäten:

  1. Datenspeicher
  2. Datenverarbeitung

Zur Datenspeicherung kommt HDFS (Hadoop Distributed File System) ins Spiel. Wenn wir jetzt sagen, dass wir Daten in der Hive-Tabelle haben, bedeutet das zwei Dinge:

  1. Daten sind in HDFS
  2. Wir haben eine Hive-Tabelle über dieser HDFS-Datei erstellt und laden die Daten dieser HDFS-Datei in die Hive-Tabelle.

Damit die Hive-Drop-Tabelle die Daten enthält, ist die Datendatei eine Grundvoraussetzung. In diesem Artikel erfahren Sie, wie Sie Tabellen in der Struktur löschen, was passiert, wenn die Tabelle gelöscht wird und was alles mit der Ablagetabelle in der Struktur zusammenhängt.

Arten von Drop Table in Hive

Im Hive gibt es zwei Arten von Tabellen:

  1. Interne Tabelle oder verwaltete Tabelle
  2. Externe Tabelle oder nicht verwaltete Tabelle

Verwaltete Tabelle / Interne Tabelle:

  1. In Hive ist " user / hive / warehouse " das Standardverzeichnis. Interne Tabellen werden standardmäßig in diesem Verzeichnis gespeichert. Der Speicherort muss beim Erstellen der Tabelle nicht manuell angegeben werden.
  2. Der Befehl „Tabelle löschen“ löscht die Daten dauerhaft.
  3. Hive verwaltet die gesamte Sicherheit für verwaltete Tabellen.

Ich habe bereits eine Tabelle im Verzeichnis "user / hive / warehouse" mit dem Namen "codes".

Mit dem folgenden Befehl können Sie überprüfen, ob die vorhandene Tabelle verwaltet oder nicht verwaltet wird:

Befehlssyntax:

Beschreiben Sie den formatierten Tabellennamen.

Ausgabe:

Lassen Sie uns sehen, die Daten in der Tabelle "Codes" dargestellt.

Erstens, mit Hive-Kommando

Zweitens mit Hue (Hadoop User Experience eine Web-Benutzeroberfläche)

Löschbefehl : Drop table table_name;

Ausgabe:

Wenn ich nun die Daten aus "Codes" auswählen möchte, wird mir ein Fehler angezeigt, da die Tabelle gelöscht wird.

Außerdem wird diese Tabelle nicht im Standardverzeichnis angezeigt

"Benutzer / Bienenstock / Lager"

Beobachten Sie hier,

Nicht verwaltete Tabelle / Externe Tabelle:

  1. Für externe Tabellen müssen wir den Pfad angeben, in dem diese Tabelle gespeichert werden soll. Verwenden Sie dazu das Schlüsselwort 'location' im Befehl create table.

Beispielsweise:

EXTERNE TABELLE ERSTELLEN stg_s2_json.products

(Produkt-Nr.-Zeichenfolge, Produktnamen-Zeichenfolge, Beschreibungs-Zeichenfolge, aktive Zeichenfolge, Erstellungsdatum-Zeichenfolge, aktualisierte Datums-Zeichenfolge)

ORT '/user/data/hive/stg_s2_json.db/products';

  1. Hive löscht nur die Metadaten. Daten sind permanent.
  2. Diese Tabellen können von jedem verwendet werden, der Zugriff auf HDFS hat. Daher müssen sie die Sicherheit auf Ordnerebene verwalten.

Um das Löschen der externen Tabelle zu verstehen, verwenden wir die Tabelle "Produkte".

Lassen Sie uns prüfen, ob die Tabelle intern oder extern ist. Wiederum den Befehl "description formated table_name".

Beachten Sie im Auswahlbefehl den Grenzwert 10. Tabelle Produkte enthält die folgenden Daten:

Um es in Hue zu überprüfen, sieht es so aus:

Mal sehen, was passiert, wenn wir diese Tabelle löschen:

Syntax:

Drop table table_name;

Ausgabe:

Wenn Sie nun versuchen, die Daten der Tabelle abzurufen, wird ein Fehler ausgegeben.

Erstens wird mit dem Befehl "select" auf dem Terminal ein Fehler ausgegeben, was bedeutet, dass die Metadaten für die externe Tabelle gelöscht werden.

Fehler hier beobachten:

Zweitens ist die Datei „products.json“ in HDFS immer noch vorhanden, wenn der Status der Daten überprüft wird. Dies bedeutet, dass die Daten permanent sind.

Fazit

Ich werde es Ihnen leicht machen und Ihnen die wichtigsten Punkte für beide Arten von Tischen nennen. Sie entscheiden, welcher Typ Ihren Anforderungen entspricht.

Interne Tabelle

Externe Tabelle

Auch als "Managed Table" bezeichnetAuch als "Nicht verwaltete Tabelle" bezeichnet
Sie müssen keinen Speicherort angeben. Das Standardverzeichnis von Hive verwaltet diese DatenStandort angeben müssen
Löscht die Metadaten der Tabelle sowie (Daten sind temporär)Hive lässt die Daten unberührt (Daten sind permanent)
Der Bienenstock selbst kontrolliert die Sicherheit des TischesSicherheit muss auf Ordnerebene verwaltet werden

Empfohlene Artikel

Dies ist eine Anleitung zum Hive Drop Table. Hier diskutieren wir die Einführung von Hive Drop Table, Typen von Drop Tables in Hive entlang der Syntax. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. Was ist ein Bienenstock?
  2. Bienenstock-Architektur
  3. Hive-Befehle
  4. Was ist eine Oracle-Datenbank?
  5. Hive Order By
  6. Hive-Installation

Kategorie: