Einführung in Cassandra Interview Fragen

Apache Cassandra ist ein hochverfügbares verteiltes NoSQL-Datenbankverwaltungssystem. Es ist eine Art NoSQL-Datenbank. Cassandra ist Open-Source und so konzipiert, dass es große Datenmengen verarbeiten kann und eine hohe Verfügbarkeit ohne Single Point of Failure bietet. Cassandra wurde 2010 zu einem Apache-Projekt der obersten Ebene. Cassandra wurde in Java geschrieben und kann daher auf umfangreichen Array-Betriebssystemen und -Plattformen ausgeführt werden. Es kann flexibel in Echtzeit die Daten für die Online-Anwendungen speichern sowie Daten für das Business Intelligence-System lesen.

Liste der 10 am häufigsten gestellten Fragen und Antworten zum Cassandra-Interview 2019:

Sie haben also endlich Ihren Traumjob in Cassandra gefunden, fragen sich aber, wie Sie das Cassandra-Interview 2019 knacken können und was die wahrscheinlichen Cassandra-Interview-Fragen sein könnten. Jedes Cassandra-Interview ist anders und der Umfang eines Jobs ist auch anders. Aus diesem Grund haben wir die häufigsten Fragen und Antworten zu Cassandra-Vorstellungsgesprächen erstellt, um Ihnen dabei zu helfen, in Ihrem Interview erfolgreich zu sein.

1. Was ist NoSQL? Wie viele Arten von NoSQL-Datenbanken gibt es?

Antworten:
NoSQL (manchmal erweitert zu „nicht nur SQL“) könnte eine breite Kategorie von Managementsystemen sein, die sich in einigen wesentlichen Punkten vom klassischen Modell des relationalen Datenbankmanagementsystems (RDBMS) unterscheiden.

NoSQL-Systeme:
- Speziell für Top Load ausgelegt
- Unterstützung der horizontalen Skalierbarkeit
- Speichern Sie Daten normalerweise nicht in einer Tabelle
- Bieten Sie manchmal ultimative Konsistenz statt ACID-Transaktionen
- Fehlertoleranz
- Speichern Sie Daten auf demoralisierte Weise

Im Gegensatz zu RDBMS bieten NoSQL-Systeme:
• Bieten normalerweise keine Unterstützung für verteilte Transaktionen an
• Gewährleisten Sie keine Datenkonsistenz
• Verwenden Sie manchmal keine fortgeschrittenen RDBMS-Ideen wie Trigger, Views oder Hold-On-Prozeduren

NoSQL-Implementierungen lassen sich anhand ihrer Implementierungsweise kategorisieren:
1. Dokumentenspeicher (MongoDB, Couchbase)
2. Schlüsselwertspeicher (Redis, Voldemort)
3. Spaltenspeicher (Cassandra)
4. Grafikspeicher (Neo4j, Giraph)
5. Mehrwertige Datenbanken
6. Objektdatenbanken
7. Triplestore
8. Tupelspeicher

2. Erklären Sie, was Cassandra ist. Warum wird Cassandra anderen NoSQL-Datenbanken wie HBase vorgezogen?

Antworten:
Apache Cassandra ist ein hochverfügbares verteiltes NoSQL-Datenbankverwaltungssystem, das Open Source ist und für den Umgang mit großen Datenmengen ausgelegt ist und eine hohe Verfügbarkeit ohne Single Point of Failure bietet. Cassandra wurde bei Facebook entwickelt, und nachdem Facebook den Code als Open-Source-Version bereitgestellt hatte, wurde Cassandra 2010 zu einem Apache-Projekt der obersten Ebene. Es handelt sich um eine Art NoSQL-Datenbank. Cassandra ist in Java geschrieben und kann auf einer Vielzahl von Betriebssystemen und Plattformen ausgeführt werden. Es kann als beides dienen
• Echtzeit-Datenspeichersystem für Online-Anwendungen
• Lesen Sie auch Daten für das Business Intelligence-System

In Bezug auf Leistung und Verfügbarkeit ist die Cassandra für verteilte Daten in großem Maßstab konzipiert und für sehr schnelle Schreibvorgänge optimiert.

Die verschiedenen Faktoren, die für die Verwendung von Cassandra verantwortlich sind, sind:

• Skalierbarkeit von Gigabyte zu Petabyte
• Es könnte sich um eine spaltenorientierte Information handeln
• Kein einziger Versagenszweck
• Keine Notwendigkeit für eine separate Caching-Ebene
• Flexibler Schemastil
• Es verfügt über eine vielseitige Datenspeicherung, einfache Wissensverteilung und schnelle Schreibvorgänge
• Es werden die Eigenschaften ACID (Atomicity, Consistency, Isolation und Durability) unterstützt
• Multi-Rechenzentrum und Cloud-fähig
• Datenkompression

3. Was ist SSTable?

Antworten:
SSTable wird auch als "Sorted String Table" bezeichnet. In ihm werden Memtables auf der Festplatte gespeichert und existieren für jede Cassandra-Tabelle. Da SStables unveränderlich ist, können einmal geschriebene Daten in keinem Fall mehr hinzugefügt oder entfernt werden. Für jede SSTable werden von Cassandra 3 Dateien wie Partitionsindex, Partitionsumriss und ein Bloom-Filter erstellt.

4. Mem-Tabelle in Cassandra definieren?

Antworten:
Es ist eine speicherresidente Datenstruktur. Sobald ein Commit-Protokoll erstellt wurde, werden die Informationen in die Mem-Tabelle geschrieben. Mem-table ist ein In-Memory / Write-Back-Cache-Haus, das aus Inhalten im Schlüssel- und Spaltenformat besteht. Die Informationen in der Mem-Tabelle sind nach Schlüsseln sortiert, und jede Spaltenfamilie besteht aus einer bestimmten Mem-Tabelle, die das Spaltenwissen über den Schlüssel abruft.

5. Wie speichert Cassandra Daten?

Antworten:
• Alle Daten bleiben als Bytes erhalten
• Wenn Sie einen Prüfer angeben, stellt Cassandra sicher, dass das Quadrat der Bytes gemäß der Anforderung codiert ist.
• Während Composite nur Byte-Arrays mit einer bestimmten Codierung sind, speichert es für jedes Element eine Zwei-Byte-Länge, gefolgt vom codierten Element der Computerspeichereinheit, gefolgt von einem Abschlussbit.

6. Was sind Cassandra-CQL-Sammlungen?

Antworten:
Cassandra bietet eine prompte Cassandra-Abfragesprachen-Shell (cqlsh), mit der Sie Cassandra Query Language (CQL) ausführen können. In Cassandra können Sie CQL-Sammlungen auf folgende Arten verwenden
• Liste: Wird verwendet, wenn die Reihenfolge der Informationen beibehalten werden muss und der Wert mehrmals gespeichert werden soll (enthält die Liste der Unterscheidungsmerkmale).
• SET: Wird für das Cluster von Komponenten verwendet, um diese zu speichern, und wird in sortierter Reihenfolge zurückgegeben
• MAP: Dies ist ein Datentyp, der zum Speichern eines Schlüssel-Wert-Paares von Elementen verwendet wird

7. Erklären Sie das Cassandra-Datenmodell?

Antworten:
Das Cassandra-Datenmodell besteht aus vier Hauptsäulen: Cluster, Schlüsselbereich, Spalte, Spalte und Familie.
Cluster - Cluster enthalten viele Knoten (Computer) und können mehrere Schlüsselbereiche enthalten.
Schlüsselbereich - Ein Schlüsselbereich ist ein Namespace zum Gruppieren mehrerer Spaltenfamilien.
Spalte - Eine Spalte enthält einen Namen, einen Wert und einen Zeitstempel.
Familie - Eine Spaltenfamilie enthält mehrere Spalten, auf die durch eine Reihe von Schlüsseln verwiesen wird.

8. Erklären Sie, wie Cassandra schreibt?

Antworten:
Cassandra schreibt zuerst Daten in ein Festschreibungsprotokoll und ordnet sie dann in einer Tabelle und in einem Memtable zu. Ein Schreibvorgang ist erfolgreich, wenn beide Festschreibungen abgeschlossen sind. Memtables und SSTables werden pro Spaltenfamilie erstellt. Schreibvorgänge werden in einer Tabellenstruktur namens SSTable (Sorted String Table) auf die Festplatte geschrieben. Im Fehlerfall wird beim Schreiben auf den SSTable Cassandra lediglich das Commit-Protokoll abgespielt. Mit diesem Stil verfügt Cassandra über die niedrigste Festplatten-E / A und bietet eine hohe Schreibgeschwindigkeit, da das Commit-Protokoll nur zum Anhängen verwendet wird und Cassandra beim Schreiben nicht nach Daten sucht.

9. Erklären Sie, wie Cassandra Daten löscht.

Antworten:
SSTables sind unveränderliche Tabellen. Wenn eine Zeile gelöscht werden muss, weist Cassandra dem Spaltenwert einen speziellen Wert zu, der als Tombstone bezeichnet wird. Sobald die Daten gelesen wurden, wird der Tombstone-Wert als gelöscht berücksichtigt.

10. Was ist abstimmbare Konsistenz in Cassandra? Wie viele Arten von einstellbarer Konsistenz werden in Cassandra unterstützt?

Antworten:
Tunable Consistency könnte ein fantastisches Merkmal von Cassandra sein, das es zu einer bevorzugten Wahl macht. Konsistenz bezieht sich auf die aktuellen und synchronen Datenzeilen aller ihrer Replikate. Cassandra's Tunable Mit Cassandra's Tunable Consistency können Benutzer die Konsistenz auswählen, die für ihre Anwendungsfälle am besten geeignet ist.
Es werden zwei Konsistenzen unterstützt: Eventual Consistency und Strong Consistency.
Eventual Consistency - Die eventuelle Konsistenz wird angewendet, sobald für ein bestimmtes Datenelement keine neuen Aktualisierungen vorgenommen wurden. Alle Zugriffe werden schließlich auf den zuletzt aktualisierten Wert zurückgeführt. Systeme mit einer möglichen Konsistenz, die dafür bekannt sind, eine erreichte Reproduktionskonvergenz zu besitzen.
Cassandra nachfolgende Bedingungen für robuste Konsistenz:
R + W> N
Hier
N: Anzahl der Replikate
W: Anzahl der Knoten, die für ein erfolgreiches Schreiben übereinstimmen müssen
R: Anzahl der Knoten, die für ein erfolgreiches Lesen übereinstimmen müssen

Empfohlener Artikel

Dies ist ein Leitfaden für die Liste der Fragen und Antworten in Vorstellungsgesprächen mit Cassandra, damit der Kandidat diese Fragen in Vorstellungsgesprächen mit Cassandra einfach durchgreifen kann. Dieser Artikel enthält alle wichtigen Fragen und Antworten zu Cassandra-Vorstellungsgesprächen. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. 5 interessante Interview-Fragen, die Sie kennen müssen! (Merken)
  2. Interview-Fragen für einen Equity Researcher
  3. 20 Spannende Interviewfragen für einen Projektmanagerjob
  4. Faktoren zum kompetenzbasierten Interview (Leitfaden)
  5. Was sind NOSQL-Kenntnisse?
  6. Ist das Cassandra NoSQL?