Le 23 principali domande dell'intervista a Cassandra e amp; Risposte

Anonim

Scarica il pdf

1) Spiega cos'è Cassandra?

Cassandra è un sistema di archiviazione dati open source sviluppato su Facebook per la ricerca nella posta in arrivo e progettato per archiviare e gestire grandi quantità di dati attraverso i server delle merci. Può essere utilizzato come entrambi

  • Sistema di archiviazione dati in tempo reale per applicazioni online
  • Anche come database ad alta intensità di lettura per il sistema di business intelligence

2) Qual è l'uso di Cassandra e perché usare Cassandra?

Cassandra è stata progettata per gestire i carichi di lavoro dei big data su più nodi senza alcun singolo punto di errore. I vari fattori responsabili dell'utilizzo di Cassandra sono

  • È tollerante ai guasti e coerente
  • Scalabilità da gigabyte a petabyte
  • È un database orientato alle colonne
  • Nessun singolo punto di errore
  • Non è necessario un livello di memorizzazione nella cache separato
  • Progettazione flessibile dello schema
  • Ha un'archiviazione flessibile dei dati, una facile distribuzione dei dati e scritture veloci
  • Supporta le proprietà ACID (Atomicity, Consistency, Isolation, and Durability)
  • Multi-data center e capacità cloud
  • Compressione dati

3) Spiega cos'è il tipo composito in Cassandra?

In Cassandra, il tipo composto consente di definire una chiave o un nome di colonna con una concatenazione di dati di diverso tipo. È possibile utilizzare due tipi di tipo composito

  • Row Key
  • Nome colonna

4) Come Cassandra archivia i dati?

  • Tutti i dati archiviati come byte
  • Quando specifichi il validatore, Cassandra garantisce che quei byte siano codificati secondo i requisiti
  • Quindi un comparatore ordina la colonna in base all'ordinamento specifico per la codifica
  • Mentre i compositi sono solo array di byte con una codifica specifica, per ogni componente memorizza una lunghezza di due byte seguita dal componente codificato in byte seguito da un bit di terminazione.

5) Indicare quali sono i componenti principali di Cassandra Data Model?

I componenti principali di Cassandra Data Model sono

  • Grappolo
  • Keyspace
  • Colonna
  • Colonna e famiglia

6) Spiega cos'è una famiglia di colonne in Cassandra?

La famiglia di colonne in Cassandra è indicata per una raccolta di righe.

7) Spiega cos'è un ammasso in Cassandra?

Un cluster è un contenitore per gli spazi delle chiavi. Il database Cassandra è segmentato su più macchine che operano insieme. Il cluster è il contenitore più esterno che dispone i nodi in un formato ad anello e assegna loro i dati. Questi nodi hanno una replica che prende in carico in caso di errore di gestione dei dati.

8) Elenca gli altri componenti di Cassandra?

Gli altri componenti di Cassandra sono

  • Nodo
  • Banca dati
  • Grappolo
  • Registro commit
  • Mem-table
  • SSTable
  • Filtro Bloom

9) Spiega cos'è un keyspace in Cassandra?

In Cassandra, un keyspace è uno spazio dei nomi che determina la replica dei dati sui nodi. Un cluster è costituito da un keyspace per nodo.

10) Qual è la sintassi per creare keyspace in Cassandra?

La sintassi per la creazione dello spazio delle chiavi in ​​Cassandra è

CREA KEYSPACE WITH

11) Indicare quali sono i valori memorizzati nella colonna Cassandra?

In Cassandra Column, fondamentalmente ci sono tre valori

  • Nome colonna
  • Valore
  • Timestamp

12) Indicare quando puoi usare Alter keyspace?

ALTER KEYSPACE può essere utilizzato per modificare proprietà come il numero di repliche e la lasting_write di un keyspace.

13) Spiega cos'è Cassandra-Cqlsh?

Cassandra-Cqlsh è un linguaggio di query che consente agli utenti di comunicare con il proprio database. Usando Cassandra cqlsh, puoi fare le seguenti cose

  • Definisci uno schema
  • Inserisci un dato e
  • Esegui una query

14) Indicare cosa determinano i comandi di shell "Capture" e "Consistency"?

Ci sono vari comandi della shell Cqlsh in Cassandra. Il comando "Cattura", cattura l'output di un comando e lo aggiunge a un file mentre, il comando "Consistenza" mostra il livello di coerenza corrente o imposta un nuovo livello di coerenza.

15) Cosa è obbligatorio durante la creazione di una tabella in Cassandra?

Sebbene la creazione di una chiave primaria della tabella sia obbligatoria, è composta da una o più colonne di una tabella.

16) Indicare cosa è necessario fare attenzione durante l'aggiunta di una colonna?

Durante l'aggiunta di una colonna è necessario fare attenzione che il file

  • Il nome della colonna non è in conflitto con i nomi delle colonne esistenti
  • La tabella non è definita con l'opzione di archiviazione compatta

17) Indica cosa sono le collezioni Cassandra-CQL?

Le raccolte CQL di Cassandra consentono di memorizzare più valori in una singola variabile. In Cassandra, puoi utilizzare le raccolte CQL nei seguenti modi

  • Elenco : viene utilizzato quando è necessario mantenere l'ordine dei dati e un valore deve essere memorizzato più volte (contiene l'elenco di elementi univoci)
  • SET : viene utilizzato per un gruppo di elementi da memorizzare e restituito in ordini ordinati (contiene elementi ripetuti)
  • MAP : è un tipo di dati utilizzato per memorizzare una coppia di elementi chiave-valore

18) Spiega come Cassandra scrive i dati?

Cassandra scrive i dati in tre componenti

  • Scrittura del log di commit
  • Scrittura memorabile
  • Scrittura stabile

Cassandra scrive prima i dati in un log di commit e poi in una struttura di tabelle in memoria memorizzabile e infine in SStable

19) Spiega cos'è Memtable in Cassandra?

  • Cassandra scrive i dati in una struttura in memoria nota come Memtable
  • È una cache in memoria con contenuto archiviato come chiave / colonna
  • Per chiave I dati memorizzabili vengono ordinati
  • C'è un Memtable separato per ogni ColumnFamily e recupera i dati della colonna dalla chiave

20) Spiegare in cosa consiste SStable?

SStable consiste principalmente di 2 file

  • File indice (filtro Bloom e coppie offset chiave)
  • File di dati (dati effettivi della colonna)

21) Spiegare a cosa serve Bloom Filter in Cassandra?

Un filtro bloom è una struttura di dati efficiente in termini di spazio che viene utilizzata per verificare se un elemento è un membro di un set. In altre parole, viene utilizzato per determinare se un SSTable dispone di dati per una determinata riga. In Cassandra viene utilizzato per salvare l'IO durante l'esecuzione di una RICERCA CHIAVE.

22) Spiega come Cassandra scrive i dati modificati nel commitlog?

  • Cassandra concatena i dati modificati in commitlog
  • Commitlog funge da registro per il ripristino di un arresto anomalo dei dati
  • Fino a quando i dati modificati non vengono concatenati all'operazione di scrittura del commitlog, non verrà mai considerata riuscita

I dati non andranno persi una volta che il commitlog viene scaricato nel file

23) Spiega come Cassandra cancella i dati?

Gli SSTables non sono modificabili e non possono rimuovere una riga da SSTables. Quando una riga deve essere eliminata, Cassandra assegna al valore della colonna un valore speciale chiamato Tombstone. Quando i dati vengono letti, il valore Tombstone viene considerato cancellato.