Was ist Data Mart? - Typen, Funktionen und Schritte zum Implementieren von Data Mart

Inhaltsverzeichnis:

Anonim

Einführung in Data Mart

Die Welt wird immer digitaler und jede Organisation generiert mehrere Petabyte an Daten. Data Mart ist eine solche Klassifizierung von Daten aus einem Data Warehouse, in dem die Konzentration auf ein Thema liegt.

Wir können sagen, dass es sich um Daten handelt, die sich auf eine bestimmte Abteilung oder Kategorie wie Vertrieb, Finanzen oder Marketing usw. beziehen. Grundsätzlich handelt es sich um eine Untermenge von Data Warehousing. Da es eine Konzentration auf bestimmte Themen oder Abteilungen gibt, können wir sagen, dass die Quelle begrenzt ist oder von sehr wenigen Quellen abhängt.

Data Mart gegen Data Warehouse

Ein Data Warehouse ist ein Warehouse mit einer Sammlung von Daten aus mehreren Streams des Betreffs. Der Wartungs- und Steuerungsteil wie das Sammeln und Verarbeiten von Rohdaten wird hauptsächlich von IT-Gruppen von Corporate Information Technology durchgeführt, die verschiedene Dienste für die Mutterunternehmen bereitstellen.

Das Data Warehouse wird auch als zentrales oder Enterprise Data Warehouse bezeichnet. Daher ist die Quelle für ein Data Warehouse im Gegensatz zum Data Mart, bei dem es sich in einigen Fällen um eine Teilmenge des Data Warehouse handelt, mehrfach.

Arten von Data Mart

Es gibt normalerweise drei Arten von Data Marts. Sie sind:

1. Abhängiges Data Warehouse

Ein abhängiger Datamart stammt ausschließlich aus dem Data Warehouse, und alle gruppierten abhängigen Datamarts bilden ein Enterprise Data Warehouse. Es handelt sich lediglich um eine Teilmenge des Data Warehouse, da es aus dem zentralen DW erstellt wird.

Da saubere und zusammengefasste Daten bereits im zentralen Data Warehouse vorhanden sind, wird der ETT-Prozess oder das Extrahieren von Transformation und Transport vereinfacht. Wir müssen hier nur die bestimmte Teilmenge identifizieren und darüber hinaus eine ETT durchführen.

Diese Data Marts sind in der Regel darauf ausgelegt, eine bessere Verfügbarkeit und eine viel bessere Leistung bei besserer Kontrolle und Effizienz zu erzielen.

2. Unabhängiger Data Mart

Dies wird nicht aus dem zentralen Data Warehouse erstellt und die Quelle kann davon abweichen. Da die Daten nicht aus dem zentralen DW-ETT-Prozess stammen, ist dies etwas anders.

Der größte Teil des unabhängigen Datamart wird von einer kleineren Gruppe von Organisationen verwendet, und die Quelle hierfür ist ebenfalls begrenzt. Der unabhängige Datamart wird im Allgemeinen erstellt, wenn wir eine Lösung in relativ kurzer Zeit benötigen.

3. Hybrid Data Mart

Mit Hybrid Data Mart können Sie die Daten aus allen anderen Quellen als dem zentralen Data Warehouse DW gruppieren. Wenn wir uns mit Ad-hoc-Integration befassen, wird dies der Spitzenarbeit an allen Produkten, die den Organisationen extern hinzugefügt wurden, sehr zugute kommen.

Funktionen von Data Mart

Nachfolgend sind einige der Funktionen eines Data Mart aufgeführt:

  • Da sich die Datenquelle auf das Thema konzentriert, wird die Benutzerantwortzeit durch die Verwendung des Themas verlängert.
  • Für häufig benötigte Daten ist die Verwendung von Data Marts von Vorteil, da diese Teilmenge des zentralen DW ist und daher die Datengröße geringer ist.
  • Da das Datenvolumen begrenzt ist, wird die Verarbeitungszeit im Vergleich zu zentralen Dws erheblich verkürzt.
  • Diese sind im Grunde agil und können die Änderungen im Modell im Vergleich zum Data Warehouse relativ schnell und effizient aufnehmen.
  • Datamart verlangt von einem einzelnen Fachexperten, dass er im Gegensatz zu Lagerdaten das Fachwissen verarbeitet, das wir für mehrere Fachlager benötigen. Aus diesem Grund halten wir Data Mart für agiler.
  • Wir können Zugriffskategorien mit partitionierten Daten auf eine niedrige Ebene trennen, und mit Data Mart ist dies sehr einfach.
  • Die Abhängigkeit von der Infrastruktur ist sehr begrenzt und Daten können nach der Segmentierung auf verschiedenen Hardwareplattformen gespeichert werden.

Schritte zum Implementieren von Data Mart

Nachfolgend sind die Schritte aufgeführt, die zur Implementierung erforderlich sind.

1. Entwerfen

Dies wird der erste Schritt in der Implementierung sein, in dem alle erforderlichen Aufgaben und Quellen identifiziert werden, um technische und geschäftliche Informationen zu sammeln. Später wird der logische Plan implementiert und nach Überprüfung in einen physischen Plan umgewandelt. Auch die logische und physikalische Struktur der Daten wird hier festgelegt, wie die Daten und das Feld der Partition wie das Datum oder eine andere Datei partitioniert werden sollen.

2. Aufbau

Dies ist die zweite Phase der Implementierung, in der mithilfe von RDBMS physische Datenbanken generiert wurden, die im Rahmen des Entwurfsprozesses und der logischen Strukturen festgelegt wurden. Alle Objekte wie Schema, Indizes, Tabellen, Ansichten usw. werden erstellt.

3. Bestücken

Dies ist die dritte Phase, in der Daten bei der Datenbeschaffung eingetragen werden. Alle erforderlichen Transformationen werden vor dem Auffüllen der Daten implementiert.

4. Zugreifen

Dies ist der nächste Implementierungsschritt, bei dem die aufgefüllten Daten zur Abfrage für die Erstellung von Berichten verwendet werden. Endbenutzer verwenden diesen Schritt, um die Daten mithilfe von Abfragen zu verstehen.

5. Verwalten

Dies ist die letzte Phase der Implementierung des Data Mart. Hier werden verschiedene Aufgaben wie das Zugriffsmanagement, die Systemoptimierung und das Optimieren, Verwalten und Hinzufügen neuer Daten zum Data Mart sowie das Planen von Wiederherstellungsszenarien zur Behebung von Fehlerfällen erledigt.

Vorteile von Data Mart

Im Folgenden sind einige der Vorteile der Verwendung aufgeführt.

  • Es ist eine der kostengünstigsten Alternativen zu einem Data Warehouse, bei dem Sie nur ein kleines Datensegment bearbeiten müssen.
  • Durch die Trennung von Daten von Quellen wird der Datamart effizienter, da eine bestimmte Gruppe von Personen die Daten von einer bestimmten Quelle verarbeiten kann, anstatt das Data Warehouse zu verwenden.
  • Ein schnellerer Zugriff auf die Daten ist mithilfe von Data Mart möglich, wenn bekannt ist, auf welche Teilmenge zugegriffen werden muss.
  • Datamart ist viel einfacher zu verwenden, sodass Endbenutzer problemlos Abfragen darüber durchführen können.
  • Zur Implementierungszeit zu kommen, erfordert Data Mart im Vergleich zum Data Warehouse weniger Zeit, da die Daten in Gruppen unterteilt sind.
  • Historische Daten eines bestimmten Themas können für eine einfache Trendanalyse verwendet werden.

Fazit

Da es sich auf einen einzigen Funktionsbereich konzentriert, ergeben sich sowohl für den Prozessimplementierer als auch für den Endbenutzer zahlreiche Vorteile. Daher ist eine effiziente Implementierung von Marts zusammen mit einem Data Warehouse in der Organisation erforderlich.

Empfohlene Artikel

Dies ist eine Anleitung zu What is Data Mart. Hier diskutieren wir die Einführung, Funktionen und Top-3-Typen zusammen mit ihren Funktionen und Schritten. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Oracle Data Warehousing
  2. R Datentypen
  3. Python-Datentypen
  4. Cassandra Datenmodellierung
  5. Vollständiger Leitfaden zum Datenmodell in Cassandra