Ab initio Interview Fragen und Antworten

Sie haben also endlich Ihren Traumjob in Ab initio gefunden, fragen sich aber, wie Sie das Ab initio-Interview knacken können und was die wahrscheinlichen Ab initio-Interview-Fragen für 2018 sein könnten. Jedes Interview ist anders und der Umfang eines Jobs ist auch anders. Vor diesem Hintergrund haben wir die häufigsten Fragen und Antworten zu Ab initio-Vorstellungsgesprächen für 2018 erstellt, um Ihnen dabei zu helfen, Ihr Interview erfolgreich zu gestalten.

Nachstehend finden Sie die wichtigsten Fragen zu Ab initio-Vorstellungsgesprächen, die in einem Interview häufig gestellt werden. Diese Interviewfragen gliedern sich in zwei Teile:

Teil 1 - Fragen zum Ab-initio-Vorstellungsgespräch (Grundkenntnisse)

In diesem ersten Teil werden grundlegende Fragen und Antworten zu Ab initio-Vorstellungsgesprächen behandelt.

1. Welche Komponenten oder Funktionen stehen in ab initio zur Verfügung?

Antworten:
Die Hauptkomponenten von ab initio sind hier unten aufgeführt:

KomponenteZweck
DedupDuplikate entfernen
BeitretenVerknüpfen mehrerer Eingabedatensätze basierend auf einem gemeinsamen Schlüsselwert.
SortierenDiese Komponente ordnet die Daten neu. Es nimmt die Sortierreihenfolge und speichert die Daten
FilterJegliche bedingte Entfernung von Daten.
ReplizierenDiese Komponente dient hauptsächlich der Parallelität, da eine zusätzliche Kopie der Daten nützlich ist, während andere Knoten nicht verfügbar sind.
verschmelzenDiese Komponente dient zum Kombinieren mehrerer Eingabedaten.

2. Welche Arten der Parallelverarbeitung gibt es?

Antworten:
Dies sind die häufigsten Fragen zu Ab initio-Vorstellungsgesprächen, die in einem Interview gestellt werden. Verschiedene Arten der Parallelverarbeitung sind:

  1. Komponentenparallelität
  2. Datenparallelität
  3. Pipeline-Parallelität

Komponentenparallelität: Eine Anwendung, in der mehrere Komponenten gleichzeitig auf dem System ausgeführt werden. Die Daten sind jedoch getrennt. Dies wird durch Parallelverarbeitung auf Komponentenebene erreicht.

Datenparallelität: Daten werden in Segmente aufgeteilt und die Operationen gleichzeitig ausgeführt. Diese Art von Prozess wird unter Verwendung der Datenparallelität erreicht

Pipeline-Parallelität: Eine Anwendung mit mehreren Komponenten, die jedoch auf demselben Dataset ausgeführt wird. Dies verwendet Pipeline-Parallelität.

3. Was ist der unterschiedliche Weg, um die Partitionen zu erreichen?

Antworten:
Es gibt mehrere Möglichkeiten, die Partitionen durchzuführen.

PartitionenBeschreibung
AusdruckDatenteilung gemäß der Datenbearbeitungssprache.
SchlüsselGruppieren der Daten nach bestimmten Schlüsseln
LastausgleichDynamischer Lastausgleich
ProzentsatzTrennen Sie die Daten, bei denen die Ausgabegröße in Bruchteilen von 100 liegt
AngebotTeilen Sie die Daten gleichmäßig anhand eines Schlüssels und eines Bereichs zwischen den Knoten auf
Round RobinVerteilen Sie die Daten gleichmäßig in Blockgröße auf die Ausgabepartitionen.

Fahren wir mit den nächsten Fragen zum Ab-initio-Interview fort.

4. Was ist ein Multifile-System?

Antworten:
Multifile ist eine Reihe von Verzeichnissen auf verschiedenen Knoten in einem Cluster. Sie besitzen eine identische Verzeichnisstruktur. Das Mehrfachdateisystem führt zu einer besseren Leistung, da es sich um eine Parallelverarbeitung handelt, bei der sich die Daten auf mehreren Datenträgern befinden.

Es wird mit der Steuerpartition auf einem Knoten und Datenpartitionen auf den anderen Knoten erstellt, um die Verarbeitung zu verteilen und die Leistung zu verbessern.

5. Unterschied zwischen Hadoop und Ab initio?

Antworten:

HadoopAb initio
Open SourceProprietäre Software
Parallelverarbeitung durch Mapper und ReducerParallelverarbeitungsarchitektur
Hierfür sind verschiedenste Daten am besten geeignetAm besten für traditionelle EDW-Implementierungen
Fehlertoleranz wird erreichtFehlertoleranz wird nicht erreicht
MapReduce wird für alle Komponenten oder Funktionen gesteuertKomponenten wie Verbinden, Gruppieren, Sortieren sind einfach

durchgeführt

Günstig als Open Source und kann alle Business Use Cases ausprobieren.Teuer und der auf einen hohen Wert anwendbare Geschäftsfall wegen der Kosten
Locker gekoppelte Komponenten, in denen benutzerdefinierte Funktionen erstellt werdenEnge Kopplung zwischen den Komponenten, da diese für den Geschäftsanwendungsfall dringend empfohlen werden.

Teil 2 - Fragen zum Ab-initio-Vorstellungsgespräch (Fortgeschrittene)

Lassen Sie uns nun einen Blick auf die erweiterten Fragen zum Ab initio-Vorstellungsgespräch werfen.

6. Welche Layouts unterstützt Ab initio?

Antworten:

  • Unterstützt serielle und parallele Layouts.
  • Ein Diagrammlayout unterstützt gleichzeitig serielle und parallele Layouts.
  • Ein Multi-File-System ist ein 4-Wege-Parallelsystem
  • Eine Komponente in einem Grafiksystem kann ein 4-Wege-Parallelsystem ausführen.

7. Welche Beziehung besteht zwischen der Enterprise-Metadatenumgebung (EME), der grafischen Entwicklungsumgebung (GDE) und dem kooperierenden System?

Antworten:
CoOperating System: Es arbeitet auf dem Betriebssystem und wird von ab initio bereitgestellt und ist die Basis für alle Ab Initio-Prozesse. Luftbefehle sind eine der Funktionen, die auf verschiedenen Betriebssystemen wie UNIX, Linux, IBM usw. Installiert werden können

Dies sind die folgenden Funktionen, die es bietet,
- Verwaltet und führt Ab Initio-Diagramme aus und steuert die ETL-Prozesse
- Bereitstellung der Erweiterungen
- ETL-Prozesse überwachen und debuggen
- Metadatenverwaltung und Interaktion mit dem EME

GDE: Es ist eine Entwurfskomponente, die zum Ausführen der ab initio-Diagramme verwendet wird.

Diagramme werden aus den Komponenten (vordefiniert oder benutzerdefiniert) und Flüssen sowie den Parametern gebildet. Es stellt den ETL-Prozess in Ab Initio bereit, der durch Diagramme dargestellt wird.

Möglichkeit zum Ausführen, Debuggen der Prozessprotokollaufträge und Verfolgen von Ausführungsprotokollen

Enterprise Meta-Environment (EME): Dies ist eine Umgebung für die Speicherung und auch für die Verwaltung von Metadaten (sowohl geschäftliche als auch technische Metadaten). Der Zugriff auf die Metadaten erfolgt sowohl über die grafische Entwicklungsumgebung als auch über den Webbrowser oder die kooperierende Befehlszeile. Es ist ein Ab-initio-Repository für alle Platzhalter.

Fahren wir mit den nächsten Fragen zum Ab initio-Interview fort.

8.Wie werden Daten verarbeitet und was sind die Grundlagen dieses Ansatzes?

Antworten:
Es gibt bestimmte Aktivitäten, die das Sammeln der Daten erfordern, und das Beste, was verarbeitet wird, hängt in vielen Fällen weitgehend davon ab. Bevor die Daten verarbeitet werden, müssen sie sich auf einem Platzhalter wie einem genau definierten Speicher befinden. Diese Aufgabe hängt von einigen wichtigen Faktoren ab

1. Erhebung von Daten
2. Präsentation
3. Endergebnisse
4. Analyse
5.Sortieren

9. Was ist der Unterschied zwischen Partitionierung mit Key und Round Robin?

Antwort :
Dies sind die fortgeschrittenen Ab initio-Interviewfragen, die in einem Interview gestellt werden. Partition nach Schlüssel
In diesem Fall müssen wir den Schlüssel angeben, auf dessen Grundlage die Partition erstellt wird. Aufgrund der schlüsselbasierten Partitionen werden ausgewogene Daten erzielt. Es ist nützlich für schlüsselabhängige
Parallelität.
Round-Robin-Partition: Bei einer gleichmäßigen Verteilung der Daten in Blockgrößenblöcken werden die Datensätze nacheinander auf die Ausgabepartition verteilt. Es ist nicht der Schlüssel
basiert und Ergebnisse sind ausgewogene Daten, insbesondere mit einer Blockgröße von 1. Es ist nützlich für
Rekord unabhängige Parallelität.

10. Wie können Sie die Leistung eines Diagramms verbessern?

Antwort :
Es gibt viele Möglichkeiten, die Leistung des Diagramms zu verbessern.
1) Reduzieren Sie die Verwendung mehrerer Komponenten in bestimmten Phasen.
2) Verwenden Sie einen verfeinerten und genau definierten Wert von max. Kernwerten für Sortier- und Verbindungskomponenten
3) Minimieren Sie die Verwendung von Funktionen für reguläre Ausdrücke wie re_index in den Übertragungsfunktionen
4) Minimieren Sie die sortierte Verknüpfungskomponente und ersetzen Sie sie nach Möglichkeit durch speicherinterne Verknüpfungen / Hash-Verknüpfungen
5) Verwenden Sie beim Sortieren, Neuformatieren und Verbinden von Komponenten nur erforderliche Felder
6) Verwenden von Phase oder der Flusspufferung bei Zusammenführungen oder sortierten Verknüpfungen
7) Verwenden Sie die Hash-Verknüpfung, wenn die beiden Eingabegruppen klein sind, andernfalls wählen Sie die sortierte Verknüpfung für die große Eingabegröße besser aus
8) Verwenden Sie für große Datenmengen Broadcast besser nicht als partitioniert
9) Reduzieren Sie die Anzahl der Sortierkomponenten während der Verarbeitung.
10) Vermeiden Sie es, Daten unnötig neu zu partitionieren

Empfohlener Artikel

Dies war ein Leitfaden für die Liste der Fragen und Antworten zu Ab-initio-Vorstellungsgesprächen, damit der Kandidat diese Ab-initio-Interview-Fragen leicht durchgreifen kann. Hier in diesem Beitrag haben wir uns mit den wichtigsten Fragen zu Ab initio-Vorstellungsgesprächen befasst, die in Interviews häufig gestellt werden. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Android Interview Questions - Top 10 nützliche Frage
  2. Fragen im Vorstellungsgespräch für Statistics | Nützlich und am meisten gefragt
  3. Fragen zu Minitab-Vorstellungsgesprächen - Die sieben wichtigsten hilfreichen Fragen
  4. Splunk Interview Fragen und Antworten, die Sie kennen sollten