Einführung in die Dimensionstabelle
Im Stern- oder Schneeflockenschema ist eine Dimensionstabelle vorhanden. Dimensionstabellen helfen bei der Beschreibung von Dimensionen, dh Dimensionswerten, Attributen und Schlüsseln. Es ist im Allgemeinen klein. Die Größe kann zwischen mehreren tausend Zeilen liegen. Es beschreibt die in der Faktentabelle vorhandenen Objekte. Die Dimensionstabelle bezieht sich auf die Sammlung oder Gruppe von Informationen, die sich auf ein messbares Ereignis beziehen. Sie bilden einen Kern für die dimensionale Modellierung. Es enthält eine Spalte, die als Primärschlüsselspalte betrachtet werden kann, mit deren Hilfe jede Dimensionszeile oder jeder Dimensionsdatensatz eindeutig identifiziert werden kann. Es wird mit diesem Schlüssel mit den Faktentabellen verbunden. Beim Erstellen wird ein vom System generierter Schlüssel mit dem Namen Ersatzschlüssel verwendet, um die Zeilen in der Dimension eindeutig zu identifizieren.
Warum müssen wir verwenden?
- Es hilft, den Verlauf der Information oder der Dimensionsinformation zu speichern.
- Es ist einfach zu verstehen als die normalisierten Tabellen.
- Der Tabelle können weitere Spalten hinzugefügt werden, ohne dass dies Auswirkungen auf die vorhandenen Anwendungen hat, die diese verwenden.
Arten der Dimensionstabelle
Im Folgenden sind die verschiedenen Arten der Dimensionstabelle aufgeführt:
1. SCD (sich langsam ändernde Abmessungen)
Die Dimensionsattribute, die sich tendenziell langsam mit der Zeit ändern, anstatt sich in regelmäßigen Zeitabständen zu ändern, werden als sich langsam ändernde Dimensionen bezeichnet. Zum Beispiel bei Adress- und Rufnummernänderungen aber nicht regelmäßig. Sehen wir uns ein Beispiel für einen Mann an, der in verschiedene Länder reist, also muss er seine Adresse entsprechend diesem Land ändern. Dies kann auf drei Arten erfolgen:
Typ1: Überschreibt den vorherigen Wert. Diese Methode ist einfach anzuwenden und hilft Platz zu sparen und somit die Kosten zu senken. In diesem Szenario geht jedoch die Geschichte verloren.
Der Tisch vor dem Wechsel
ICH WÜRDE | NAME | LAND | STAATSANGEHÖRIGKEIT |
1001 | Rachel | Indien | indisch |
Tabelle nach der Änderung
ICH WÜRDE | NAME | LAND | STAATSANGEHÖRIGKEIT |
1001 | Rachel | China | indisch |
Typ2: Fügen Sie eine neue Zeile mit dem neuen Wert hinzu. Bei dieser Methode wird der Verlauf gespeichert und kann bei Bedarf verwendet werden. Es nimmt aber viel Platz in Anspruch und erhöht somit die Kosten.
Der Tisch vor dem Wechsel
ICH WÜRDE | NAME | LAND | STAATSANGEHÖRIGKEIT |
1001 | Rachel | Indien | indisch |
Tabelle nach der Änderung
ICH WÜRDE | NAME | LAND | STAATSANGEHÖRIGKEIT |
1001 | Rachel | Indien | indisch |
1001 | Rachel | China | indisch |
Typ3: Fügen Sie eine neue Spalte hinzu. Es ist der beste Ansatz, da die Geschichte leicht zu pflegen ist.
Die Tabelle vor dem Wechsel
ICH WÜRDE | NAME | LAND | STAATSANGEHÖRIGKEIT |
1001 | Rachel | Indien | indisch |
Tabelle nach Änderung
ICH WÜRDE | NAME | LAND | ALTES LAND | STAATSANGEHÖRIGKEIT |
1001 | Rachel | China | Indien | indisch |
2. Angepasste Dimension
Diese Dimension wird von mehreren Themenbereichen oder Data Marts gemeinsam genutzt. Same kann in verschiedenen Projekten verwendet werden, ohne dass Änderungen daran vorgenommen werden müssen. Dies wird verwendet, um die Konsistenz aufrechtzuerhalten. Übereinstimmende Dimensionen sind diejenigen, die genau gleich sind oder eine geeignete Teilmenge einer anderen Dimension.
3. Junk-Dimension
Eine Junk-Dimension ist eine Gruppe von Attributen mit geringer Kardinalität. Es enthält verschiedene oder verschiedene Attribute, die mit keinem anderen Attribut in Beziehung stehen. Diese können verwendet werden, um RCD (sich schnell ändernde Abmessungen) wie Flaggen, Gewichte usw. zu implementieren.
4. Entartete Dimension
Wenn Attribute in der Faktentabelle selbst und nicht als separate Dimensionstabelle gespeichert sind, werden diese Attribute als entartete Dimension bezeichnet. Für zB Ticketnummer, Rechnungsnummer, Transaktionsnummer etc.
5. Rollenspieldimension
Die mehrfachen Beziehungen zur Faktentabelle werden als Rollenspieldimension bezeichnet. Mit anderen Worten, wenn derselbe Dimensionsschlüssel mit allen zugehörigen Attributen mit vielen Fremdschlüsselpräsentationen in der Faktentabelle verknüpft wird. Es kann mehrere Zwecke innerhalb derselben vorhandenen Datenbank erfüllen.
Wie funktioniert es im Data Warehouse?
- Dimension bezieht sich auf die Sammlung oder Gruppe von Informationen, die sich auf ein messbares Ereignis beziehen. Sie bilden einen Kern für die dimensionale Modellierung. Beim Erstellen einer Dimension wird eine Struktur eines Projekts generiert. Created kann projektübergreifend eingesetzt werden und spiegelt die Idee der Wiederverwendbarkeit wider. Wenn eine Änderung daran vorgenommen wird, wirkt sich dies nur auf diese bestimmte Tabelle aus. Wenn ein Bericht erstellt werden soll, kann der Benutzer die Daten aus Dimensionstabellen entnehmen, die alle erforderlichen Informationen enthalten.
- Bei der Dimensionsmodellierung werden die Atomdaten in dimensionale Strukturen geladen. Anschließend werden die Dimensionsmodelle generiert oder um die Geschäftsprozesse herum aufgebaut. Beim Erstellen muss berücksichtigt werden, dass Domänenwerte gefiltert und Bezeichnungen der Berichte in diesen Tabellen gespeichert werden. Es muss sichergestellt sein, dass beim Erstellen der Dimensionstabelle ein Ersatzschlüssel (vom System generierter Schlüssel, der beim Erstellen der Dimensionstabelle verwendet wird, um jeden in der Dimensionstabelle vorhandenen Datensatz eindeutig zu identifizieren) verwendet wird. Es muss denormalisiert werden, da es die Aufgabe des Benutzers ist, die Daten einfach und effizient zu lesen und zu analysieren, anstatt Transaktionen zu verwalten. Das Hauptziel von dimension ist das Filtern, Gruppieren und effiziente Etikettieren.
Vorteile
Nachfolgend sind die verschiedenen Vorteile der Maßtabelle aufgeführt:
- Es hat eine einfache Struktur.
- Es ist leicht zu analysieren und zu verstehen.
- Denormalisierte Daten.
- Hilft bei der Pflege historischer Informationen für jede Dimension.
- Einfach, Daten von ihm zurückzugewinnen.
- Schnell zu erstellen und umzusetzen.
- Es gibt den Kontext, der jeden Geschäftsprozess umgibt.
Schlussfolgerung - Dimensionstabelle
Dies ist ein wesentlicher Bestandteil der Datenmodellierung. Es wird im Stern- oder Schneeflockenschema verwendet. Es enthält die Dimensionen, Schlüssel und Werte der Attribute der Faktentabelle. Es gibt verschiedene Typen, die in verschiedenen Szenarien verwendet werden.
Empfohlene Artikel
Dies ist eine Anleitung zur Dimensionstabelle. Hier haben wir Typen, Funktionsweise der Dimensionstabelle im Data Warehouse mit Vorteilen besprochen. Sie können auch unsere anderen verwandten Artikel durchgehen, um mehr zu erfahren.
- Faktentabelle vs Dimensionstabelle
- Was ist Faktentabelle?
- Was ist Tableau?
- Datenüberblendung in Tableau