Was ist das Datenmodell?

Die Interpretation und Dokumentation bestehender Softwareentwurfs- und -entwicklungsverfahren und -transaktionen wird als Informationsmodellierung bezeichnet. Die Methoden und Instrumente der Informationsmodellierung vereinfachen die komplexen Systemkonstruktionen, um das Re-Engineering der Informationsverarbeitung zu vereinfachen. Es wird verwendet, um ein Information Warehouse logisch und physisch zu gestalten. In diesem Thema lernen wir die Data Warehouse-Modellierung kennen.

Bedarf an Data Warehouse-Modellierung

  1. Sammlung von Geschäftsanforderungen
  2. Verbesserung der Datenbankleistung
  3. Bietet Dokumentation des Quell- und Zielsystems

1. Business Requirements Collection

Ein Data Warehouse dient in der Regel dazu, die für das Data Warehouse erforderlichen Entitäten und die Fakten zu ermitteln, die mit den Datenarchitekten und Geschäftsbenutzern aufgezeichnet werden müssen. Dieses erste Design wird häufig wiederholt, bevor das endgültige Modell festgelegt wird.

An dieser Stelle müssen wir die in der Entwurfsphase vorherrschenden Nachteile überwinden. Da ein vorhandenes System ein Data Warehouse implementiert, beziehen Architekten manchmal einen großen Teil des alten Systems in das neue Design ein, was Zeit spart oder Offenlegung bedeutet.

Das logische Modell erfasst effektiv die Bedürfnisse des Unternehmens und dient als Grundlage für das physikalische Modell.

2. Verbessern der Datenbankleistung

Die Überprüfung der Effizienz ist ein wesentliches Merkmal eines Datenspeichers. In einem Data Warehouse sind enorme Datenmengen enthalten. Daher ist es sehr wichtig, ein Datenmodellprodukt für das Metadaten- und Datenmanagement zu verwenden, das von BI-Verbrauchern verwendet wird.

Das physikalische Modell fügt eine Indizierung hinzu, um die Effizienz der Datenbank zu optimieren. Die Schemata werden auch manchmal modifiziert. Wenn beispielsweise ein Sternschema eine schnellere Datenwiederherstellung verspricht, kann es in ein Schneeflockenschema geändert werden

3. Dokumentation des Quell- und Zielsystems

Bei der Entwicklung eines ETL-Systems ist es sehr wichtig, die physischen und logischen Modelle der Quell- und Zielsysteme zu überprüfen.

Diese Dokumentation wird durch Informationsmodellierung als Referenz für die Zukunft angeboten.

Konzeptionelles Datenmodell

Die höchste Beziehung zwischen den verschiedenen Entitäten wird durch ein konzeptionelles Datenmodell bestimmt.

Dies ist der erste Schritt zur Erstellung eines Top-Down-Datenmodells, das die genaue Darstellung der Unternehmensorganisation darstellt.

Entwirft die gesamte Datenbankstruktur und listet die Themenbereiche auf

Umfasst die Arten und Wechselwirkungen von Entitäten. Symbolische Notationen (IDEF1X oder IE) stellen die Verbindung zwischen den Themenfeldern dar. In einem Informationsmodell zeigt die Kardinalität die Beziehung eins zu eins oder mehrere

Modell der Beziehungsdaten

Die Modellierung relativer Informationen in transaktionsorientierten OLTP-Schemata wird verwendet. Ein relationales Datenmodell weist wichtige Merkmale auf:

  • Verwendung des Schlüssels
  • Daten Redundanz
  • Beziehung zwischen Daten

Verwendung des Schlüssels

Der Hauptschlüssel in einer Tabelle ist der Schlüssel. Es wird als eine einzige Identifikation verwendet. Eine Spalte ungleich Null ist ein Primärschlüssel. Für den Hauptschlüssel wird der Fremdschlüssel verwendet. Sie verknüpfen die Informationen von einer Tabelle mit einer anderen Tabelle und stellen eine Verbindung her.

Daten Redundanz

Das Beziehungsinformationsmodell wendet Informationsintegritätsgesetze an

Datenredundanz wird beseitigt. Eine Information wird nicht wiederholt gesammelt. Dies gewährleistet die Konsistenz der Daten und eine eingeschränkte Datenspeicherung

Beziehung zwischen Daten

Alle Daten werden in Tabellen gespeichert und jede Beziehung verfügt über Spalten und Zeilen.

Ein Header und ein Body sollten auf dem Tisch liegen. Die Überschrift ist die Tabellenliste der Spalten und die Tabelle besteht aus den Zeilen. Das Tupel ist der einzelne Wert, der durch einen Spalten- und einen Zeilenschnitt erzeugt wird.

Mehrdimensionales Datenmodell

Eine Organisation, die die wesentlichen Einheiten eines Unternehmens und die Verbindung zwischen ihnen widerspiegelt, ist eine logische Perspektive eines mehrdimensionalen Datenmodells. Die Datenbanken und Tabellen sind nicht auf eine natürliche Datenbank beschränkt. Die ER-Diagramme sind nicht dargestellt.

  • Attribute
  • Fakten
  • Abmessungen

ein. Abmessungen

  1. Ein Aspekt ist eine Datensammlung, die aus einzelnen Informationskomponenten besteht, die sich nicht überlappen
  2. Sie können Informationen zum Anzeigen und Durchsuchen für Endbenutzer festlegen, gruppieren und filtern.

b. Fakten

  1. Eine Tabelle mit Spalten, mit denen aus numerischen Gründen auf Unternehmensprobleme geantwortet wird.
  2. Die Maßnahmen sind additive, semi-additive und nicht-additive

c. Attribute

  1. Die abstrakten Bedingungen sollen die Zusammenfassung von Informationen in einer Studie erleichtern
  2. Sie können auch als Spaltenüberschriften bezeichnet werden, die nicht in einer Berichtsberechnung enthalten sind.

Vorteile des Maßmodells

  1. Die Standardisierung von Dimensionen erleichtert die Berichterstellung über Geschäftsbereiche hinweg.
  2. Dimensioniert auch zum Speichern von Daten, um das Abrufen von Daten aus den Daten zu vereinfachen, wenn die Daten in der Datenbank gespeichert sind.
  3. Die Firma ist für das dimensionale Modell sehr verständlich. Dieses Modell basiert auf Unternehmensklauseln, sodass das Unternehmen die Bedeutungen der einzelnen Realitäten, Aspekte oder Merkmale versteht.
  4. Zur schnellen Informationsabfrage werden dimensionale Modelle deformiert und optimiert. Viele Beziehungsdatenbankplattformen erkennen dieses Modell an und optimieren Abfrageleistungspläne.
  5. Maßmodelle können Änderungen bequem aufnehmen. Dimensionstabellen können zusätzliche Spalten enthalten, ohne dass die Verwendung dieser Tabellen durch aktuelle Company Intelligence-Apps beeinträchtigt wird.

Best Practices-Datenmodellierung

Vor Beginn des Datenmodells sollte eine vollständige Analyse der Bedürfnisse des Kundenunternehmens durchgeführt werden. Es sollte äußerst wichtig sein, die Kunden zu treffen, um die Anforderungen und Techniken der Informationsmodellierung zu besprechen und umgehend von den Fachspezialisten des Unternehmens bestätigen zu lassen.

Das Unternehmen sollte das Datenmodell verstehen, sei es in einem Grafik- / Metadatenformat oder als Geschäftsregel für Texte.

Empfohlene Artikel

Dies ist eine Anleitung zur Data Warehouse-Modellierung. Hier diskutieren wir das Datenmodell, warum es in Data Warehousing benötigt wird, zusammen mit seinen Vorteilen und Modelltypen. Sie können auch den folgenden Artikel lesen, um mehr zu erfahren -

  1. Data Warehouse-Tools
  2. Arten von Data Warehouse
  3. Datenanalyse-Tools
  4. Data Science Tools
  5. Oracle Data Warehousing

Kategorie: