Einführung in das ETL-Interview - Fragen und Antworten

ETL steht für Extract-Transform-Load. Es ist ein Systemfundament von Data Warehouse, bei dem die Daten aus den verschiedenen Quellen extrahiert und dann transformiert werden, wobei die Daten erzwungen oder verarbeitet werden, um Qualität, Konsistenz der Daten in einem geeigneten Präsentationsformat und schließlich das zu erreichen Daten werden im Präsentationsformat in Data Warehouse geladen, damit der Endbenutzer die Informationen leichter abrufen und Entscheidungen treffen kann.

Nachstehend finden Sie die wichtigsten Fragen zum ETL-Interview 2019, die in einem Interview häufig gestellt werden

Wenn Sie nach einem Job suchen, der mit ETL zusammenhängt, müssen Sie sich auf die ETL-Interview-Fragen 2019 vorbereiten. Obwohl jedes Interview anders ist und der Umfang eines Jobs auch anders ist, können wir Ihnen mit den wichtigsten Fragen und Antworten zu ETL-Interviews weiterhelfen, die Ihnen helfen, den Sprung zu wagen und Ihren Erfolg in Ihrem Interview zu sichern.

Teil 1 - Fragen zum ETL-Interview (Grundkenntnisse)

In diesem ersten Teil werden grundlegende Fragen und Antworten zu ETL-Vorstellungsgesprächen behandelt

1. Erweitern Sie das ETL-System im Data Warehouse? Erklären

Antworten:
Das ETL-System (Extract-Transform-Load) ist die Grundlage des Data Warehouse. Ein ordnungsgemäß entworfenes ETL-System extrahiert Daten aus den Quellsystemen, erzwingt Datenqualitäts- und Konsistenzstandards, bestätigt Daten, damit separate Quellen zusammen verwendet werden können, und liefert schließlich Daten in einem präsentationsbereiten Format, damit Anwendungsentwickler Anwendungen und Endbenutzer erstellen können kann Entscheidungen treffen.

2. Die Bedeutung des ETL-Systems im Data Warehouse?

Antwort :
Beseitigt Fehler und korrigiert fehlende Daten. Es bietet dokumentierte Vertrauensmaßstäbe für Daten. Erfasst den grenzüberschreitenden Datenfluss zur sicheren Aufbewahrung. Passt Daten aus mehreren Quellen an, die zusammen verwendet werden sollen. Strukturiert Daten, die von Endbenutzertools verwendet werden können.

3. Was ist der tägliche Prozess im ETL-System?

Antwort :
Erstellen Sie die Entwicklungs- / Test- / Produktionssuite für ETL-Prozesse. Verstehen der Kompromisse zwischen verschiedenen Datenstrukturen im Hintergrund, einschließlich Einfachdateien, normalisierten Schemas, XML-Schemas und (dimensionalen) Star-Join-Schemas. Analysieren und extrahieren Sie Quelldaten. Erstellen Sie ein umfassendes Datenbereinigungssubsystem. Strukturieren Sie Daten in dimensionalen Schemata, um Endbenutzern, Business-Intelligence-Tools, Data-Mining-Tools, OLAP-Cubes und Analyseanwendungen eine optimale Bereitstellung zu ermöglichen. Liefern Sie Daten mit denselben Techniken effektiv an hoch zentralisierte und tiefgreifend verteilte Data Warehouses. Optimieren Sie den gesamten ETL-Prozess, um eine optimale Leistung zu erzielen.

Fahren wir mit den nächsten Fragen zum ETL-Interview fort.

4. Datenformate im ETL-System?

Antwort :
In ETL gibt es verschiedene Datenformate, darunter Flatfiles, XML-Datasets, unabhängige DBMS-Arbeitstabellen, E / R-Schemata (Normalized Entity / Relationship) und dimensionale Datenmodelle.

5. Datenprofilerstellung im ETL-System?

Antwort :
Datenprofilerstellung ist eine systematische Untersuchung der Qualität, des Umfangs und des Kontexts einer Datenquelle, um die Erstellung eines ETL-Systems zu ermöglichen. Im Extremfall erfordert eine sehr saubere Datenquelle, die vor dem Eintreffen im Data Warehouse gut gewartet wurde, nur minimale Transformationen und Eingriffe durch den Benutzer, um direkt in endgültige Dimensionstabellen und Faktentabellen geladen zu werden.

6. Was ist ein ETL-Validator?

Antwort :
ETL Validator ist ein Datentest-Tool, das das Testen von Datenintegrations-, Data Warehouse- und Datenmigrationsprojekten erheblich vereinfacht. Es nutzt unsere patentierte ELV-Architektur, um Daten aus Datenquellen wie Datenbanken, Flat Files, XML-, Hadoop- und BI-Systemen zu extrahieren, zu laden und zu validieren.

Teil 2 - Fragen zu ETL-Vorstellungsgesprächen (Fortgeschrittene)

Lassen Sie uns nun einen Blick auf die erweiterten ETL-Interviewfragen werfen.

7. Was sind die Operationen im ETL-System?

Antwort :
Die folgenden drei Vorgänge: Extrahiert die Daten aus Ihrem transnationalen System, bei dem es sich um eine Oracle-, Microsoft- oder eine andere relationale Datenbank handeln kann. Transformiert die Daten durch Ausführen von Datenbereinigungsvorgängen. Beim Laden werden die Daten in die Zieldatenbank geschrieben.

8. Nennen Sie einige der am häufigsten auf dem Markt verwendeten ETL-Tools.

Antworten:
Es gibt verschiedene ETL-Tools auf dem Markt, aber einige der am meisten bevorzugten ETL-Tools
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• SAS-Datenverwaltung.
• Power Center Informatica.
• Elixier-Repertoire für Daten-ETL.
• Datenmigrator (IBI)
• SQL Server Integration Services (SSIS)

9. Welche Aufgaben und Zuständigkeiten hat das ETL-Team?

Antworten:
Die Aufgaben des ETL-Teams auf höchster Ebene bestehen darin, den Backroom des Data Warehouse aufzubauen.
• Liefern Sie Daten am effektivsten an Endbenutzertools
• Wertschöpfung für Daten in den Reinigungs- und Anpassungsschritten
• Schützen und dokumentieren Sie die Herkunft der Daten
• Extrahieren von Daten aus den Originalquellen
• Daten zur Qualitätssicherung und -reinigung
• Anpassen der Etiketten und Maße an die zu erreichenden Daten
• Konsistenz über die Originalquellen hinweg
• Liefern von Daten in einem physischen Format, das von Abfragetools verwendet werden kann.
• Berichtsersteller und Dashboards.

Fahren wir mit den nächsten Fragen zum ETL-Interview fort.

10. Welche Rolle spielt die Wirkungsanalyse im ETL-System?

Antworten:
Die Auswirkungsanalyse untersucht die mit einem Objekt verknüpften Metadaten (in diesem Fall eine Tabelle oder Spalte) und ermittelt, was von einer Änderung der Struktur oder des Inhalts betroffen ist. Das Ändern von Data-Staging-Objekten kann Prozesse unterbrechen, die für das ordnungsgemäße Laden des Data Warehouse von entscheidender Bedeutung sind. Das Zulassen von Ad-hoc-Änderungen an Data-Staging-Objekten wirkt sich nachteilig auf den Erfolg Ihres Projekts aus. Sobald eine Tabelle im Staging-Bereich erstellt wurde, müssen Sie eine Auswirkungsanalyse durchführen, bevor Änderungen daran vorgenommen werden. Viele Anbieter von ETL-Tools bieten Funktionen zur Auswirkungsanalyse an. Diese Funktionen werden jedoch beim Proof-of-Concept-Verfahren für ETL-Produkte häufig übersehen, da es sich um eine Hintergrundfunktion handelt
Nicht wirklich wichtig, bis das Data Warehouse betriebsbereit ist und sich weiterentwickelt.

11. Wie verarbeitet man die Flatfile mit fester Länge?

Antworten:
Ein Dateilayout mit fester Länge sollte den Dateinamen enthalten, an dem das Feld beginnt. seine Länge; und dessen Datentyp (normalerweise Text oder Nummer). Manchmal wird die Endposition geliefert. Ist dies nicht der Fall, müssen Sie die Endposition jedes Felds basierend auf seiner Anfangsposition und Länge berechnen, wenn dies von Ihrem ETL-Tool benötigt wird. In den meisten ETL-Tools müssen Sie das Dateilayout der Einfachdatei wahrscheinlich einmal manuell eingeben. Nachdem das Layout eingegeben wurde, merkt sich das Tool das Layout und erwartet dasselbe Layout jedes Mal, wenn es mit der tatsächlichen Einfachdatei interagiert. Wenn sich das Dateilayout ändert oder die Daten von ihren zugewiesenen Positionen abweichen, muss der ETL-Prozess so programmiert werden, dass er fehlschlägt. Versuchen Sie bei der Verarbeitung von Flatfiles mit fester Länge zu überprüfen, ob die Positionen der Daten in der Datei korrekt sind. Eine schnelle Überprüfung zur Validierung der Positionen besteht darin, ein beliebiges Datums- (oder Uhrzeit-) Feld zu testen, um sicherzustellen, dass es ein gültiges Datum ist. Wenn die Positionen verschoben sind, enthält das Datumsfeld höchstwahrscheinlich alphanumerische Zeichen oder unlogische Zahlen. Andere Felder mit sehr spezifischen Domänen können auf die gleiche Weise getestet werden. XML bietet konkretere Validierungsmöglichkeiten. Wenn die Datenüberprüfung oder -konsistenz ein Problem darstellt, versuchen Sie, den Datenanbieter davon zu überzeugen, die Daten im XML-Format bereitzustellen.

12. Warum Echtzeit-ETL im Data Warehouse?

Antworten:
Das Data Warehouse musste den Entscheidungsträgern in den Unternehmen einen unerschütterlichen Datenbestand bereitstellen und eine zuverlässige Informationsbasis bieten, auf der sie stehen können. Für die aktuelle Berichterstellung für eine funkelnde Datenbank wurden Geschäftsbenutzer zu den Produktionsanwendungen geleitet, die das Geschäft ausführen. Daher mussten Benutzer im Data Warehouse ein historisches Bild des Geschäftsverlaufs von gestern abrufen und in vielen OLTP-Systemen nachsehen, um ein Bild des heutigen Geschäftsverlaufs zu erhalten. Geschäftsanwender haben diese Kluft nie voll akzeptiert. Data Warehouses benötigen natürlich unbedingt konstante Kundeninformationsströme aus einem Betrieb, aber zunehmend sind betriebliche Systeme auch auf die Anreicherung von Kundeninformationen durch Data Warehouse angewiesen. Es ist daher vorhersehbar, dass Unternehmen begonnen haben, nach Alternativen für die Architektur zu suchen, die allgemeinere Integrationsszenarien unterstützen, mit denen Betriebsdaten mit immer größerer Dringlichkeit zwischen Anwendungen und gleichzeitig in das und aus dem Lager verschoben werden können.

Empfohlene Artikel

Dies war ein Leitfaden für die Liste der Fragen und Antworten zu ETL-Vorstellungsgesprächen, damit der Kandidat diese ETL-Interviewfragen leicht durchgreifen kann. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Azure Paas vs Iaas - Eigenschaften
  2. 9 Amazing MapReduce Interview Fragen und Antworten
  3. Die 11 nützlichsten Fragen und Antworten zu RDBMS-Interviews
  4. 10 Most Awesome PHP Interview Fragen für erfahrene
  5. Kennen Sie die Top 5 nützliche DBA Interview Fragen und Antworten

Kategorie: