Questions d'entretiens chez Introduction To Cassandra

Apache Cassandra est un système de gestion de base de données distribuée «NoSQL» hautement disponible. Il s'agit d'un type de base de données NoSQL. Cassandra est open-source et est conçu de telle manière qu'il peut gérer de grandes quantités de données, offrant une haute disponibilité sans point de défaillance unique. Cassandra est devenu un projet Apache de haut niveau en 2010. Cassandra a été écrit en langage java et peut donc fonctionner sur de vastes systèmes d'exploitation et plates-formes. Il peut être flexible dans le stockage en temps réel des données pour les applications en ligne ainsi que lire des données pour le système de Business Intelligence.

Liste des 10 questions et réponses les plus fréquemment posées lors des entretiens Cassandra 2019:

Vous avez donc finalement trouvé votre emploi de rêve à Cassandra mais vous vous demandez comment résoudre l'interview de Cassandra 2019 et quelles pourraient être les questions probables de l'interview de Cassandra. Chaque entretien avec Cassandra est différent et la portée d'un travail est également différente. En gardant cela à l'esprit, nous avons conçu les questions et réponses d'entrevue les plus courantes de Cassandra pour vous aider à réussir votre entrevue.

1. Qu'est-ce que NoSQL? Combien de types de bases de données NoSQL existe-t-il?

Répondre:
NoSQL (parfois étendu à «pas seulement SQL») pourrait être une large catégorie de systèmes de gestion qui s'opposent au modèle classique du système de gestion de base de données relationnelle (SGBDR) de plusieurs façons importantes.

Systèmes NoSQL:
- Spécialement conçu pour une charge maximale
- Prise en charge native de l'évolutivité horizontale
- Ne stocke généralement pas de données dans une table
- Offrent parfois une cohérence ultime plutôt que des transactions ACID
- Tolérance de panne
- Stocker les données de manière démoralisée

Contrairement aux SGBDR, aux systèmes NoSQL:
• Ne propose généralement pas d'assistance pour les transactions distribuées
• Ne garantissez pas la cohérence des données
• N'utilisez pas parfois des idées avancées de SGBDR, comme les déclencheurs, les vues, maintenez les procédures

Les implémentations NoSQL peuvent être classées selon leur mode d'implémentation:
1. Magasins de documents (MongoDB, Couchbase)
2. Magasins de valeurs-clés (Redis, Voldemort)
3. Magasins de colonnes (Cassandra)
4. Graph Stores (Neo4j, Giraph)
5. Bases de données à valeurs multiples
6. Bases de données d'objets
7. Triplestore
8. Magasin de tuple

2. Expliquez ce qu'est Cassandra? Pourquoi Cassandra est-elle préférée aux différentes bases de données NoSQL comme HBase?

Répondre:
Apache Cassandra est un système de gestion de base de données distribuée «NoSQL» hautement disponible qui est une source ouverte et conçu pour gérer de grandes quantités de données, offrant une haute disponibilité sans point de défaillance unique. Cassandra a été développée chez Facebook et après que Facebook a ouvert le code, Cassandra est devenu un projet Apache de haut niveau en 2010. Il s'agit d'un type de base de données NoSQL. Cassandra est écrite en Java et peut fonctionner sur une vaste gamme de systèmes d'exploitation et de plates-formes. Il peut servir à la fois
• Système de stockage de données en temps réel pour les applications en ligne
• Lire également les données du système de Business Intelligence

Pour les performances et la disponibilité, le Cassandra est conçu pour des données distribuées à grande échelle et il est optimisé pour des écritures très rapides.

Les différents facteurs responsables de l'utilisation de Cassandra sont

• Évolutivité de gigaoctets à pétaoctets
• Il pourrait s'agir d'une information orientée colonne
• Aucun but unique d'échec
• Pas besoin d'une couche de mise en cache distincte
• Style de schéma flexible
• Il a un stockage de données polyvalent, une distribution simple des connaissances et des écritures rapides
• Il prend en charge les propriétés ACID (atomicité, cohérence, isolation et durabilité)
• Multi-datacenter et capacité cloud
• Compression des données

3. Qu'est-ce que SSTable?

Répondre:
SSTable est également appelé «table de chaînes triées». Les tables de mémoire y sont stockées sur disque et existent pour chaque table Cassandra. Étant immuables, SStables ne permet en aucune façon d'ajouter et de supprimer des éléments de données une fois écrits. Pour chaque SSTable, 3 fichiers sont créés par Cassandra comme l'index de partition, le contour de la partition et un filtre de bloom.

4. Définir Mem-table dans Cassandra?

Répondre:
Il s'agit d'une structure de données résidant en mémoire. une fois le journal de validation, les informations sont écrites dans la table mem. Mem-table est une mémoire cache en mémoire / réécriture composée de contenu au format clé et colonne. Les informations contenues dans une table mem- a sont triées par clé, et chaque famille de colonnes se compose d'une table mem définie qui récupère la connaissance des colonnes via la clé.

5. Comment Cassandra stocke les données?

Répondre:
• Toutes les données sont conservées en octets
• Lorsque vous spécifiez un validateur, Cassandra garantit la mesure carrée de ces octets codés selon la demande.
• Bien que le composite ne soit que des tableaux d'octets avec un codage spécifique, il stocke pour chaque élément une longueur de deux octets suivie de l'élément codé de l'unité de mémoire de l'ordinateur suivi d'un bit de terminaison.

6. Mentionnez ce que sont les collections Cassandra-CQL?

Répondre:
Cassandra fournit un shell de langage de requête Cassandra rapide (cqlsh) à l'aide duquel vous pouvez exécuter le langage de requête Cassandra (CQL). Dans Cassandra, vous pouvez utiliser les collections CQL des manières suivantes
• Liste: elle est utilisée une fois que l'ordre des informations doit être maintenu, et la valeur doit être maintenue plusieurs fois (contient la liste des éléments distinctifs)
• SET: il est utilisé pour le cluster de composants à stocker et est revenu dans des commandes triées
• MAP: il s'agit d'un type de données utilisé pour stocker une paire d'éléments clé-valeur

7. Expliquez le modèle de données Cassandra?

Répondre:
Le modèle de données Cassandra se compose de 4 piliers principaux qui sont le cluster, l'espace clé, la colonne, la colonne et la famille.
Clusters - Les clusters contiennent de nombreux nœuds (machines) et peuvent contenir plusieurs espaces clés.
Espace de clés - Un espace de clés est un espace de noms pour regrouper plusieurs familles de colonnes.
Colonne - Une colonne contient un nom, une valeur et un horodatage.
Famille - Une famille de colonnes contient plusieurs colonnes référencées par une ligne de clés.

8. Expliquez comment Cassandra écrit?

Répondre:
Cassandra écrit d'abord les données dans un journal de validation, puis s'associe dans memtable et dans une table. Une écriture réussit lorsque les deux validations sont terminées. Memtables et SSTables sont créés par famille de colonnes. Les écritures sont écrites sur le disque dans une structure de table appelée SSTable (table de chaînes triées). En cas de défaut, une fois que vous avez écrit sur SSTable, Cassandra ne fera que rejouer le journal de validation. Avec ce style, Cassandra possède les E / S de disque les plus faibles et offre des performances d'écriture à grande vitesse car le journal de validation est uniquement en ajout et Cassandra ne recherche pas les écritures.

9. Expliquez comment Cassandra supprime les données?

Répondre:
Les SSTables sont des tables immuables. une fois qu'une ligne doit être supprimée, Cassandra attribue la valeur de la colonne avec une valeur spéciale appelée Tombstone. Une fois les données lues, la valeur Tombstone est prise en compte comme supprimée.

10. Qu'est-ce que la cohérence ajustable dans Cassandra? Combien de types de cohérence ajustable sont pris en charge dans Cassandra?

Répondre:
La cohérence ajustable pourrait être une caractéristique fantastique de Cassandra qui en fait une sélection préférée. La cohérence fait référence aux lignes de données à jour et synchrones sur toutes leurs répliques. Cassandra's Tunable Cohérence Tunable Consistency permet aux utilisateurs de choisir la cohérence la plus adaptée à leurs cas d'utilisation.
Il prend en charge deux consistances: cohérence éventuelle et cohérence forte.
Cohérence éventuelle - La cohérence éventuelle est utilisée une fois qu'aucune nouvelle mise à jour n'est effectuée sur un élément de données donné, tous les accès reviennent éventuellement à la dernière mise à jour. Des systèmes dont la consistance est réputée posséder leur propre convergence de reproduction.
Conditions ultérieures de Cassandra pour une cohérence robuste:
R + W> N
Ici
N: nombre de répliques
W: nombre de nœuds qui doivent se mettre d'accord pour une écriture réussie
R: nombre de nœuds qui doivent accepter une lecture réussie

Article recommandé

Ceci a été un guide pour la liste des questions et réponses d'entrevue de Cassandra afin que le candidat puisse réprimer ces questions d'entrevue de Cassandra facilement. Cet article comprend toutes les principales questions et réponses d'entrevue de Cassandra. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. 5 questions d'entrevue intéressantes que vous devez savoir! (Rappelles toi)
  2. Questions d'entrevue pour un chercheur en actions
  3. 20 questions d'entrevue passionnantes pour un emploi de chef de projet
  4. Facteurs concernant l'entrevue axée sur les compétences (guide)
  5. Qu'est-ce que les compétences NOSQL
  6. Est-ce que Cassandra NoSQL?