Unterschied zwischen Star Schema und Snowflake Schema

In diesem Artikel werden die Unterschiede zwischen dem Sternschema und dem Schneeflockenschema ausführlich erläutert. Mit Schema können Sie die gesamten Datenbanken oder Data Warehouses mithilfe relationaler Datenbanken logisch beschreiben. Die Beschreibung kann den Namen und die Details der Datensätze eines beliebigen Typs mit allen Aggregaten und Datenelementen enthalten. Data Warehouses verwenden die Schemata Star, Snowflake, Fact Constellation und Galaxy.

Sternschema

Es ist das einfachste Data Warehouse-Schema. Wie der Name schon sagt, ist seine Struktur wie ein Stern. In diesem Schema befindet sich die Faktentabelle in der Mitte, und die Anzahl der Dimensionstabellen wird über einen Fremdschlüssel zugeordnet, und die Dimensionstabelle enthält den Satz von Attributen. In diesem Schema wird jede Dimension nur mit einer Dimensionstabelle dargestellt, die Dimensionstabellen sind jedoch nicht miteinander verknüpft. Zu den Vorteilen gehören das Schneiden von Daten, ein einfaches Verständnis der Daten, eine optimale Datenträgernutzung und eine Leistungssteigerung. Sehen wir uns zum besseren Verständnis ein Beispiel an.

Beispiel:

Stellen Sie sich ein Kühlschrankhersteller vor, und wir müssen ein Schema für den Verkauf dieses Kühlschrankherstellers erstellen. Der Verkauf wird die folgenden Dimensionen haben:

  • Artikel
  • Ort
  • Ast
  • Zeit

Das Schema verfügt über eine Faktentabelle in der Mitte für Verkäufe, die mit jeder Dimension zuzuordnende Schlüssel mit zwei Kennzahlen enthält, dh verkaufte Einheiten und verkaufte Dollars.

Schneeflocke Schema

Schneeflockenschema ist die Erweiterung des Sternschemas. Es werden zusätzliche Dimensionen hinzugefügt. Wie der Name schon sagt, sieht es aus wie eine Schneeflocke. In diesem Schema werden die Dimensionstabellen normalisiert, dh die Daten werden in zusätzliche Tabellen aufgeteilt. Durch das Aufteilen der Tabelle werden Redundanz und Speicherverlust reduziert. Es hat die hierarchische Form von Maßtabellen. Die Dimensions- und Unterdimensionstabellen sind den Primär- und Fremdschlüsseln in der Faktentabelle zugeordnet. Es ist einfacher zu implementieren und benötigt weniger Speicherplatz. Da mehrere Tabellen vorhanden sind, wird die Leistung der Abfrage verringert. Es ist mehr Wartung erforderlich, da mehr Nachschlagetabellen vorhanden sind. Sehen wir uns zum besseren Verständnis ein Beispiel an.

Beispiel:

In Anbetracht des gleichen Beispiels wie oben für ein Unternehmen, das Kühlschränke herstellt, ist die Faktentabelle im Schneeflockenschema dieselbe wie im Sternschema, der Hauptunterschied besteht jedoch in der Definition oder dem Layout der Dimensionstabellen.

In diesem Schema wurde die eindimensionale Tabelle des Artikels normalisiert und aufgeteilt und eine neue Lieferantentabelle mit Informationen zum Typ des Lieferanten erstellt. In ähnlicher Weise wird die Dimensionstabelle des Standorts normalisiert und die Daten werden in eine neue Städtetabelle aufgeteilt, die Details der jeweiligen Stadt enthält.

Kopf-an-Kopf-Vergleich zwischen Sternschema und Schneeflockenschema (Infografiken)

Nachfolgend sind die 9 wichtigsten Unterschiede zwischen dem Sternschema und dem Schneeflockenschema aufgeführt.

Hauptunterschiede zwischen Sternschema und Schneeflockenschema

Lassen Sie uns einige Hauptunterschiede zwischen dem Sternschema und dem Schneeflockenschema sehen.

Sternschema:

  • Dimensionshierarchien im Sternschema werden in der Dimensionstabelle gespeichert.
  • Es enthält eine zentrale Faktentabelle, die von einer Dimensionstabelle umgeben ist.
  • In diesem Fall hat ein einzelner Join die Faktentabelle mit einer Dimensionstabelle verknüpft.
  • Es hat ein einfaches Design.
  • Die Datenstruktur ist denormalisiert.
  • Die Abfrage wird schneller ausgeführt.
  • In diesem Cube ist die Verarbeitung schneller.
  • Es hat mehr redundante Daten.
  • Es werden einfache Abfragen verwendet.
  • Das Sternschema ist leicht zu verstehen.
  • In einem Sternschema wird mehr Platz verbraucht.

Schneeflocke Schema:

  • Hierarchien in einem Schneeflockenschema werden in separaten Tabellen gespeichert.
  • Es enthält auch eine Faktentabelle, die von einer Dimensionstabelle umgeben ist, und diese Dimensionstabellen sind ferner von einer Dimensionstabelle umgeben.
  • In diesem Schema sind viele Verknüpfungen erforderlich, um die Daten abzurufen.
  • Es hat ein komplexes Design.
  • Die Datenstruktur wird im Schneeflockenschema normalisiert.
  • Die Abfrage wird vergleichsweise langsamer ausgeführt als das Sternschema.
  • Im Schneeflockenschema ist die Cube-Verarbeitung langsamer.
  • Es enthält weniger redundante Daten.
  • Es werden komplexe Abfragen verwendet.
  • Das Schneeflockenschema ist vergleichsweise schwer zu verstehen.
  • Im Schneeflockenschema wird weniger Speicherplatz verbraucht.

Star Schema vs Snowflake Schema Vergleichstabelle

Lassen Sie uns die Vergleiche zwischen Sternschema und Schneeflockenschema diskutieren.

Charakteristisch

Sternschema

Schneeflocke Schema

Wartung / ÄnderungEs verfügt über redundantere Daten und ist daher schwieriger zu ändern oder zu wartenDieses Schema ist aufgrund der geringeren Redundanz einfacher zu ändern und zu verwalten
VerständlichkeitDie Komplexität der Abfrage ist geringer und daher leicht zu verstehenAngewendete Abfragen sind komplexer und daher schwer zu verstehen
Ausführungszeit der AbfrageEs hat weniger Fremdschlüssel und daher ist die Abfrageausführung schneller und nimmt weniger Zeit in AnspruchAufgrund von mehr Fremdschlüsseln ist die Ausführungszeit der Abfrage länger oder die Abfrage wird langsam ausgeführt
Art des Data WarehouseBesser für Datenkarten mit einer Beziehung, dh einer zu einer oder einer zu vielenBesser für komplexe Beziehungen, dh viele zu viele Beziehungen
Anzahl der JoinsEs gibt mehr JoinsEs gibt weniger Joins
DimensionstabelleEs gibt nur eine Dimensionstabelle für jede DimensionEs verfügt über eine oder mehrere Dimensionstabellen für eine einzelne Dimension
BenutzerfreundlichkeitWenn die Größe der Dimensionstabelle geringer ist, dh weniger Zeilen, wird das Sternschema bevorzugtGut zu verwenden, wenn die Dimensionstabelle größer ist
Normalisierung und DenormalisierungSowohl die Faktentabelle als auch die Dimensionstabelle sind denormalisiert.Eine Faktentabelle wird denormalisiert, während die Dimensionstabelle normalisiert wird
DatenmodellEs folgt einem Top-Down-AnsatzEs folgt einem Bottom-up-Ansatz

Fazit

In diesem Artikel haben wir uns ausführlich mit dem Sternschema und dem Schneeflockenschema befasst. Diese Schemata werden zur Darstellung des Data Warehouse verwendet. Sie sind in einigen Aspekten ähnlich und in anderen unterschiedlich. Schneeflocke ist die Erweiterung des Sternschemas. Wenn Daten größer sind, wird Schneeflocke bevorzugt, da dies die Redundanz verringert, aber der Stern ist vergleichsweise beliebter als das Schneeflockenschema.

Empfohlene Artikel

Dies ist eine Anleitung zum Star Schema vs Snowflake Schema. Hier werden auch die Hauptunterschiede zwischen Sternschema und Schneeflockenschema mit Infografiken und Vergleichstabelle erörtert. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. Encoding vs Decoding - Top Unterschiede
  2. Unterschied zwischen kleinen und großen Datenmengen
  3. Funktionstests im Vergleich zu nicht funktionellen Tests
  4. Smoke Testing vs Sanity Testing
  5. Was ist Sanity Testing und wie funktioniert es?