Einführung in Pig Interview Frage und Antworten

Apache Pig ist eine Plattform auf hoher Ebene, für die Programme erstellt werden, die auf dem Hadoop ausgeführt werden. Die Sprache des Schweins ist als Schweinslatein bekannt. Pig ist in Java geschrieben und wurde von Yahoo Research und Apache Software Foundation entwickelt. Die Erstveröffentlichung fand am 11. September 2008 statt. Vorbereitung auf ein Vorstellungsgespräch in Pig. Ich bin sicher, Sie möchten die häufigsten Fragen und Antworten zum Schwein-Interview kennenlernen, mit denen Sie das Schwein-Interview mühelos knacken können.

Nachstehend finden Sie eine Liste der wichtigsten Fragen und Antworten zu Pig-Vorstellungsgesprächen, die Ihnen zur Seite stehen. Diese Interviewfragen gliedern sich in zwei Teile:

  • Teil 1 - Schwein Interview Fragen (Basic)
  • Teil 2 - Schwein Interview Fragen (Fortgeschrittene)

Teil 1 - Schwein Interview Fragen (Basic)

In diesem ersten Teil werden grundlegende Fragen und Antworten zu Vorstellungsgesprächen mit Pig behandelt

Q1.Was ist der Unterschied zwischen Map Reduce und Pig?

Antworten:
Map Reduce ist eine kompilierte Sprache, und die Codeeffizienz von Map Reduce ist hoch, und Pig ist eine Skriptsprache mit geringerer Codeeffizienz.

Q2.Was meinst du mit der Tasche in Pig?

Antworten:
Das Sammeln von Tupeln wird als Beutel bei einem Schwein bezeichnet.

F3.Was sind die komplexen Datentypen in Pig?

Antworten:
Map, Tuples und Bag sind die komplexen Datentypen von Pig.

Q4.Was ist bei Schweinen abgeflacht?

Antworten:
Wenn wir die Verschachtelung aus den Daten in Tupel oder Bag entfernen möchten, verwenden wir Flatten.

Q5. Angenommen, wir haben einen Dateinamen mit abc.csv und dem Attribut id, name, year, rating, duration. Wie werden Sie diese Datei auf ein Schwein hochladen?

Antworten:
movies = LOAD 'Pfad von abc.csv' USING Pig Storage (', ') as (ID, Name, Jahr, Bewertung, Dauer);

F6.Was ist der Unterschied zwischen PigLatin und HIVEQL?

Antworten:
HIVEQL ist eine deklarative Sprache und PigLatin ist eine prozedurale Mail.

Fahren wir mit den nächsten Fragen zum Pig-Interview fort.

F7.Was meinst du mit einem Innenbeutel und einem Außenbeutel bei Schweinen?

Antworten:
Die Beziehung innerhalb des Beutels wird auf den Innenbeutel bezogen, und die normale Beziehung wird als Außenbeutel bezeichnet.

Q8.Was ist der Unterschied zwischen Group und COGROUP?

Antworten:
Mit dem GROUP-Operator werden die Daten in einer einzigen Relation gruppiert, und mit COGROUP wird die Relation in GROUP und JOIN erstellt.

Q9.Was ist der Unterschied zwischen COUNT und COUNT_STAR?

Antworten:
Die COUNT-Funktion arbeitet nicht mit einem NULL-Wert, wenn wir ein Element in einer Tasche zählen, aber COUNT_STAR berücksichtigt den NULL-Wert.

Q10. Welche Diagnoseoperatoren stehen in Apache Pig zur Verfügung?

Antworten:
Speicherauszugsoperator, Beschreibungsoperator, Erklärungsoperator, Illustrationsoperator.

F11.Was meinen Sie mit UNION- und SPLIT-Operator?

Antworten:
Durch die Verwendung eines UNION-Operators können wir den Inhalt von zwei oder mehr Relationen zusammenführen, und ein SPILLED-Operator wird verwendet, um die einzelne Relation in zwei oder mehr Relationen aufzuteilen.

Q12.Wie bekomme ich die Top 10 Tupel aus der Relation R?

Antworten:
Mit der Funktion TOP ().

Fahren wir mit den nächsten Fragen zum Pig-Interview fort.

Q13.Was sind die Ähnlichkeiten zwischen Pig und Hive?

Antworten:
Pig use PigLatin und Hive use HiveQL konvertieren beide Befehle in MapReduce-Jobs.

Q14.was sind die verschiedenen Arten von UDF-Funktionen von JAVA, die von Apache Pig unterstützt werden?

Antworten:
Algebraische, Eval- und Filterfunktionen sind die Arten von UDF-Funktionen.

F15. Sie haben eine Datei movies.txt im HDFS-Verzeichnis mit 1000 Einträgen. Sie möchten nur die ersten 10 Datensätze aus der Datei movies.txt anzeigen. Wie wirst du das machen?

Antworten:
Zuerst müssen Sie die movies.txt mit dem Beziehungsnamen movie laden:
movies = LOAD 'Pfad von movies.txt' USING Pig Storage (', ') as (Attribute);
Ergebnis = Mitarbeiterlimit 10

Teil 2 - Schwein Interview Fragen (Fortgeschrittene)

Lassen Sie uns nun einen Blick auf die fortgeschrittenen Fragen zum Schwein-Interview werfen.

F16.Wie interagieren Benutzer mit Hadoop in Pig?

Antworten:
Mit der Grunzschale

Unterstützt Pig mehrzeilige Befehle?

Antworten:
Ja

F18.Was sind alle Statistikklassen in einem Pigstats-Paket?

Antworten:
PigStats, JobStats, OutputStats, InputStats.

Q19.Was ist UDF?

Antworten:
Die Funktion, die kein eingebauter Operator ist, sondern programmgesteuert eine Funktion zum Aufrufen der Funktionalität erstellen kann.

Frage 20: Erklären Sie die Groß- und Kleinschreibung in Pig Latin?

Antworten:
Bei den Funktionen und Namen von Beziehungen wird zwischen Groß- und Kleinschreibung unterschieden. Bei einem Namen oder Schlüsselwort und einem Parameter wird jedoch die Groß- und Kleinschreibung nicht berücksichtigt.

Q21.Was ist Grunzen beim Schwein?

Antworten:
Grunt ist ein Befehlsterminal, das eine interaktive Shell ist, in der wir Pig befehlen.

F22.Was ist die Anforderung von MapReduce bei der Pig-Programmierung?

Antworten:
MapReduce ist eine Ausführungs-Engine.

Fahren wir mit den nächsten Fragen zum Pig-Interview fort.

Q23.Was ist der Pig Motor?

Antworten:
Die Pig-Engine bietet die Ausführungsumgebung zum Ausführen der Pig-Programme. Es konvertiert die Molch-Operationen in MapReduce-Jobs.

F24.Was sind die Ausführungsmodi von Pig?

Antworten:
Lokaler Modus: Die Molchoperation wird in einer einzelnen JVM ausgeführt.
MapReduce-Modus: Der Hadoop-Cluster wird ausgeführt.

F25.Was sind die verschiedenen Eval-Funktionen bei Schweinen?

Antworten:
AVG, CONCAT, MAX, MIN, SM, SIZE, COUNT sind verschiedene EVAL-Schweinefunktionen.

Q26.Was meinst du mit LOAD and STORE in Pig?

Antworten:
Dies sind die Operatoren zum Laden und Speichern der Daten in hdfs.

Fahren wir mit den nächsten Fragen zum Pig-Interview fort.

Q27.Welche mathematischen Funktionen sind in Pig verfügbar?

Antworten:
ABS, ACOS, LOG, ROUND, CBRT, SORT sind die in Pig verfügbaren mathematischen Funktionen.

F28.Was hat das eindeutige Schlüsselwort in Pig bewirkt?

Antworten:
Bestimmte Stichwörter entfernen die doppelten Stichwörter aus den Datensätzen. Zum Beispiel:
movies = LOAD 'Pfad von abc.csv' USING Pig Storage (', ') as (ID, Name, Jahr, Bewertung, Dauer);
New_movies = distinct (ID, Name, Jahr, Bewertung, Dauer);

F29.Was meinen Sie mit primitivem Datentyp in Pig?

Antworten:
Int, Long, Float, Double, Char-Array, Byte-Array sind die primitiven Datentypen in Pig.

F30.Was meinst du mit einem Tupel in Pig?

Antworten:
Eine geordnete Menge von Feldern von Daten wird Tupel genannt.

Fazit

Wenn Sie sich auf die Hadoop-bezogenen Jobs vorbereiten, müssen Sie das Schwein darauf vorbereiten, da dieses Thema die Hauptrolle spielt, um gute Bemerkungen im Interview zu erhalten. Die oben gestellten Fragen zum Schwein-Interview helfen Ihnen dabei, die Grundlagen und theoretischen Aspekte des Schweins vorzubereiten, aber Sie müssen die Hände am Schwein haben. Es wird Ihnen helfen, Vertrauen und fortgeschrittenes Wissen aufzubauen.

Empfohlener Artikel

Dies war ein Leitfaden für Fragen und Antworten zu List Of Pig-Vorstellungsgesprächen, damit der Kandidat diese Fragen zu Pig-Vorstellungsgesprächen leicht durchgreifen kann. Hier behandelten wir sowohl grundlegende als auch fortgeschrittene Schwein-Interview-Fragen. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Nützliche Fragen zum Apache PIG-Vorstellungsgespräch
  2. C ++ Interview Fragen
  3. Fragen im Vorstellungsgespräch für Spark, die Sie kennen sollten
  4. Fragen in Vorstellungsgesprächen bei Cucumber