Einführung in das Sternschema

Sternschema ist das einfachste Ansatz- und Dimensionsmodell, bei dem die Funktionstabellen, Dimensionen und Fakten organisiert angeordnet sind. Es wird hauptsächlich in Business Intelligence und Data Warehousing angewendet. Ein Sternschema wird gebildet, indem jede Tatsache mit ihren zugehörigen Dimensionen angeordnet wird, die einem Stern ähneln. Eine Tatsache ist ein Ergebnis, das unendlich ist, z. B. Umsatzdetails und Anzahl der Anmeldungen. Eine Dimension ist die Sammlung von Referenzdaten, einschließlich Fakten wie Datum, Details zum Produkt und Kunden. Das Star-Schema ist für umfangreiche Datenabfragen in Data Warehousing, Online Analytical Processing-Datenwürfeln und Ad-hoc-Abfragen optimiert.

Wie erstelle ich ein Sternschema?

Hier wird der Benutzer durch Konvertierung des Entity-Relationship-Modells ein Star-Schema erstellen. Entity-Relationship-Modelle sind zu komplex, um die Funktionsgrößen und -attribute zu erklären, sodass sie wie folgt zum dimensionalen Sternschema vereinfacht werden:

  • Suchen Sie die Unternehmensprozedur aus der Sicht der Entitätsbeziehung und verstehen Sie das Modell, das in mehrere dimensionale Modelle unterteilt werden kann. Eine Entitätsbeziehung besteht aus Geschäftsdaten.
  • Finden Sie viele bis viele Tabellen in Entitätsbeziehung, um die Vorgehensweise des Unternehmens zu erläutern, und konvertieren Sie sie in dimensionale Modellrealitätstabellen. Diese Tabelle enthält Daten aus der Faktentabelle und einer Dimensionstabelle mit numerischen Werten und eindeutigen Schlüsselattributen.
  • Die Idee hinter diesem Prozess ist es, die austauschbasierten Informationstabellen oder die Tabellen mit gelöschten Informationen zu unterscheiden. Es ist also notwendig, viele bis zahlreiche Beziehungen zu gestalten. Beispielsweise gibt es in der ERP-Datenbank Rechnungsdetails, die die Umrechnungstabelle sind. Bei den aktualisierten und aktualisierten Details handelt es sich um Exchange-basierte Tabellen. Vergleicht man nun beide Tabellen, so ergibt sich, dass die Daten wirklich statisch sind.
  • Die Realitätstabelle ist eine Darstellung eines dimensionalen Modells, das viele bis zahlreiche Netzwerke zwischen endlichen Messungen zeigt. Dies führt dazu, dass Fremdschlüssel in Reality-Tabellen viele bis viele gemeinsam haben, was eine abzählbare Beziehung darstellt. Der Großteil dieser Tabelle fällt unter Exchange-basierte Tabellen
  • Der letzte Schritt beim Entwerfen des Sternschemas besteht darin, die vorhandenen Tabellen in Maßtabellen zu de-normalisieren. Der obligatorische Schlüssel besteht darin, einen doppelten Schlüssel zu erstellen. Dieser Schlüssel beruht auf der Realitätstabelle, die zum besseren Verständnis beiträgt. Ermitteln Sie das Datum und die Uhrzeit anhand des Entitätsbeziehungsentwurfs und legen Sie die Dimensionstabelle ab. Daten werden als Datums- und Zeitstempel gespeichert. Eine Datumsdimensionsspalte repräsentiert das Jahr, den Monat oder das Datum oder die Uhrzeit

Beispiel: Die Zeitdimensionstabelle enthält TIMEID, QuarterName, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek. Dies kann ein wichtiges Kriterium für Dimensionstabellen sein. Ebenso haben alle Tabellen eine eindeutige ID und Attribute. Abfragesprachen wie SQL können auf Data Mining, Data Warehouse und Datenanalyse angewendet werden.

Syntax der Cube-Definition:

Define cube (cube-name)(dimension-list): (measure-list)

Cubes werden bereitgestellt, um die Warnungen auf verschiedenen Ebenen zu adressieren, und die Antwortzeit für die Beantwortung der Abfrage ist minimal. Es ist als vorgefertigtes Design erhältlich und in den erforderlichen Situationen anwendbar. Das Erstellen eines Star-Schemas ist sehr einfach und effizient anzuwenden und kann auch angepasst werden. Das Ausfüllen der Faktentabelle und der Maßtabelle ist obligatorisch. Diese wird als Stern dargestellt und kann mithilfe von SQL-Abfragen oder laufendem Code erstellt werden. Dieses Design dient dem besseren Verständnis und dem einfachen Abrufen von Daten.

Merkmale des Sternschemas

1. Das Sternschema bietet schnelle Aggregationen und Berechnungen, z. B. die Summe der verkauften Artikel und die Einnahmen aus den Einnahmen, die am Ende eines jeden Monats erzielt wurden. Diese Details und Prozesse können nach Bedarf gefiltert werden, indem geeignete Abfragen formuliert werden.

2. Es hat die Fähigkeit, die Daten aus normalisierten Daten herauszufiltern und Data Warehousing-Anforderungen zu erfüllen. Die zugehörigen Informationen der normalisierten Tabelle sind in mehreren Dimensionen gestapelt. Für jede Faktentabelle wird ein eindeutiger Schlüssel generiert, um jede Zeile zu identifizieren.

3. Faktentabelle ist die Messung spezifischer Ereignisse einschließlich endlicher Zahlenwerte und besteht aus Fremdschlüsseln, die sich auf Maßtabellen beziehen. Diese Tabelle enthält Faktenwerte auf atomarer Ebene und ermöglicht das gleichzeitige Speichern mehrerer Datensätze. Es gibt drei verschiedene Arten von Faktentabellen.

4. Transaktionsfaktentabellen bestehen aus Daten zu bestimmten Ereignissen wie z. B. Urlaubsereignissen und Verkaufsereignissen.

5. Aufzeichnen von Fakten für bestimmte Zeiträume wie Kontoinformationen am Ende eines jeden Quartals.

6. Tabellen mit schneller Aggregation für einen bestimmten Zeitraum werden als akkumulierende Snapshot-Tabellen bezeichnet.

7. Maßtabellen enthalten detaillierte Attributdaten und Aufzeichnungen in der Faktentabelle. Die Maßtabelle kann unterschiedliche Merkmale aufweisen. Maßtabellen werden hauptsächlich als Maßtabelle für Zeit und Datum, Maßtabelle für Produkt und Bestellung, Maßtabelle für Mitarbeiter und Kontodetails, Maßtabelle für Geografie und Standorte verwendet. Diesen Tabellen wird ein einzelner ganzzahliger Datentyp zugewiesen, bei dem es sich um den doppelten Primärschlüssel handelt.

8. Der Benutzer kann seinen Tisch nach Bedarf gestalten. Wenn er beispielsweise eine Umsatzdimensionstabelle mit Produkt- und Kundenschlüssel, Datums- und Zeitschlüssel benötigt, generiert der Umsatz den Schlüssel. Wenn der Geschäftsmann eine Produktdimensionstabelle mit Schlüsselattributen wie Farbe, Kaufdatum, Aktionsschlüssel und Kundenschlüssel erstellt.

Vorteile

  • Es besteht aus einer einfachen Logik und Abfragen, mit denen die Daten leicht aus dem Transaktionsprozess extrahiert werden können.
  • Es hat eine gemeinsame Berichtslogik, die dynamisch impliziert wird.
  • Sternschema kann eine Leistungssteigerung für Berichtsanwendungen bieten.
  • Sternschema, das durch Füttern von Cubes erstellt wurde, die vom Online-Transaktionsprozess angewendet wurden, um die Cubes effektiv zu erstellen und zum Laufen zu bringen.

Nachteile

  • Es hat eine hohe Integrität und einen hohen nicht normalisierten Zustand. Wenn der Benutzer die Werte nicht aktualisiert, wird der gesamte Prozess reduziert. Der Schutz und die Sicherheit sind nicht bis zum Limit zuverlässig. Es ist nicht so flexibel wie ein analytisches Modell und dehnt seine effiziente Unterstützung nicht auf viele Beziehungen aus.
  • In der Datenbank wird ein Sternschema bereitgestellt, um die schnellere Wiederherstellung von Daten zu steuern. Die Abfrage wird verwendet, um den Bedarf auszuwählen, anstatt die gesamte Datenbank zu durchsuchen. Die gefilterten und ausgewählten Daten können in verschiedenen Fällen angewendet werden. Daher ist dieses Sternschema ein einfaches Modell, das leicht übernommen werden kann.

Empfohlener Artikel

Dies ist eine Anleitung zu Was ist ein Sternschema? Hier diskutieren wir die Einführung in Star Schema und seine Eigenschaften zusammen mit Vor- und Nachteilen. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren -

  1. Übersicht über die Faktentabelle
  2. Stern Schema vs Schneeflocke Schema | Top Unterschiede
  3. Data Warehouse-Modellierung mit Typen
  4. AWS-Datenbanken mit Vorteilen
  5. AWS-Datenpipeline

Kategorie: