Top 23 Cassandra-sollicitatievragen en -antwoorden

Download PDF

1) Leg uit wat Cassandra is?

Cassandra is een open source gegevensopslagsysteem dat door Facebook is ontwikkeld voor het doorzoeken van inboxen en is ontworpen voor het opslaan en beheren van grote hoeveelheden gegevens op commodity-servers. Het kan als beide dienen

  • Realtime gegevensopslagsysteem voor online toepassingen
  • Ook als leesintensieve database voor business intelligence-systeem

2) Wat is het nut van Cassandra en waarom Cassandra gebruiken?

Cassandra is ontworpen om big data-workloads over meerdere knooppunten af ​​te handelen zonder enig storingspunt. De verschillende factoren die verantwoordelijk zijn voor het gebruik van Cassandra zijn:

  • Het is fouttolerant en consistent
  • Schaalbaarheid van gigabytes naar petabytes
  • Het is een kolomgeoriënteerde database
  • Geen single point of failure
  • Geen aparte cachelaag nodig
  • Flexibel schemaontwerp
  • Het heeft flexibele gegevensopslag, gemakkelijke gegevensdistributie en snel schrijven
  • Het ondersteunt ACID-eigenschappen (Atomicity, Consistentie, Isolatie en Duurzaamheid)
  • Geschikt voor meerdere datacenters en cloud
  • Data compressie

3) Leg uit wat het composiettype is in Cassandra?

In Cassandra maakt het samengestelde type het mogelijk om een ​​sleutel- of kolomnaam te definiëren met een aaneenschakeling van gegevens van verschillende typen. U kunt twee soorten composiettype gebruiken:

  • Rijsleutel
  • Kolomnaam

4) Hoe bewaart Cassandra gegevens?

  • Alle gegevens opgeslagen als bytes
  • Wanneer u validator opgeeft, zorgt Cassandra ervoor dat die bytes worden gecodeerd volgens de vereisten
  • Vervolgens bestelt een comparator de kolom op basis van de volgorde die specifiek is voor de codering
  • Hoewel composiet slechts byte-arrays zijn met een specifieke codering, slaat het voor elke component een lengte van twee bytes op, gevolgd door de door bytes gecodeerde component gevolgd door een afsluitbit.

5) Noem wat de belangrijkste componenten van het Cassandra Data Model zijn?

De belangrijkste componenten van Cassandra Data Model zijn:

  • TROS
  • Sleutelruimte
  • Kolom
  • Column & Familie

6) Leg uit wat een kolomfamilie in Cassandra is?

Kolomfamilie in Cassandra wordt verwezen voor een verzameling rijen.

7) Leg uit wat een cluster in Cassandra is?

Een cluster is een container voor keyspaces. Cassandra-database is gesegmenteerd over verschillende machines die samen werken. Het cluster is de buitenste container die de knooppunten in een ringformaat rangschikt en er gegevens aan toewijst. Deze nodes hebben een replica die de leiding neemt in geval van een storing in de gegevensverwerking.

8) Noem de andere componenten van Cassandra?

De andere componenten van Cassandra zijn:

  • Knooppunt
  • Datacenter
  • TROS
  • Logboek vastleggen
  • Mem-tafel
  • SSTable
  • Bloeifilter

9) Leg uit wat een sleutelruimte is in Cassandra?

In Cassandra is een sleutelruimte een naamruimte die gegevensreplicatie op knooppunten bepaalt. Een cluster bestaat uit één keyspace per node.

10) Wat is de syntaxis om keyspace in Cassandra te creëren?

Syntaxis voor het maken van keyspace in Cassandra is

MAAK TOETSENRUIMTE MET

11) Noem wat zijn de waarden die zijn opgeslagen in de Cassandra-kolom?

In Cassandra Column zijn er in principe drie waarden

  • Kolomnaam
  • Waarde
  • Tijdstempel

12) Vermelden wanneer u Alter keyspace kunt gebruiken?

ALTER KEYSPACE kan worden gebruikt om eigenschappen zoals het aantal replica's en de sustainable_write van een keyspace te wijzigen.

13) Leg uit wat Cassandra-Cqlsh is?

Cassandra-Cqlsh is een querytaal waarmee gebruikers kunnen communiceren met de database. Door Cassandra cqlsh te gebruiken, kunt u de volgende dingen doen:

  • Definieer een schema
  • Voer een gegevens in en
  • Een zoekopdracht uitvoeren

14) Noem wat bepaalt de shell-commando's Capture en Consistentie?

Er zijn verschillende Cqlsh-shell-commando's in Cassandra. Command Capture, legt de uitvoer van een opdracht vast en voegt deze toe aan een bestand, terwijl opdracht Consistentie het huidige consistentieniveau weergeeft of een nieuw consistentieniveau instelt.

15) Wat is verplicht bij het maken van een tabel in Cassandra?

Hoewel het maken van een primaire tabelsleutel verplicht is, bestaat deze uit een of meer kolommen van een tabel.

16) Vermeld waar op gelet moet worden bij het toevoegen van een kolom?

Bij het toevoegen van een kolom moet u ervoor zorgen dat de

  • Kolomnaam is niet in strijd met de bestaande kolomnamen
  • Tafel is niet gedefinieerd met compacte opslagoptie

17) Noem wat Cassandra-CQL-collecties zijn?

Cassandra CQL-collecties helpen u om meerdere waarden in één variabele op te slaan. In Cassandra kunt u CQL-verzamelingen op de volgende manieren gebruiken:

  • Lijst : Het wordt gebruikt wanneer de volgorde van de gegevens moet worden gehandhaafd en een waarde meerdere keren moet worden opgeslagen (bevat de lijst met unieke elementen)
  • SET : Het wordt gebruikt om een ​​groep elementen op te slaan en terug te sturen in gesorteerde volgorde (bevat herhalende elementen)
  • KAART : Het is een gegevenstype dat wordt gebruikt om een ​​sleutel/waarde-paar elementen op te slaan

18) Leg uit hoe Cassandra gegevens schrijft?

Cassandra schrijft gegevens in drie componenten

  • Commitlog schrijven
  • Memtable schrijven
  • SSstabiel schrijven

Cassandra schrijft eerst gegevens naar een commit-log en vervolgens naar een in-memory tabelstructuur memtable en ten slotte in SStable

19) Leg uit wat Memtable is in Cassandra?

  • Cassandra schrijft de gegevens naar een geheugenstructuur die bekend staat als Memtable
  • Het is een in-memory cache met inhoud opgeslagen als sleutel/kolom
  • Op sleutel worden Memtable-gegevens gesorteerd
  • Er is een aparte Memtable voor elke ColumnFamily en deze haalt kolomgegevens op uit de sleutel

20) Leg uit waaruit bestaat SStable?

SStable bestaat voornamelijk uit 2 bestanden

  • Indexbestand (Bloemfilter & Key-offsetparen)
  • Gegevensbestand (werkelijke kolomgegevens)

21) Leg uit waarvoor Bloom Filter wordt gebruikt in Cassandra?

Een bloom-filter is een ruimtebesparende gegevensstructuur die wordt gebruikt om te testen of een element lid is van een set. Met andere woorden, het wordt gebruikt om te bepalen of een SSTable gegevens heeft voor een bepaalde rij. In Cassandra wordt het gebruikt om IO op te slaan bij het uitvoeren van een KEY LOOKUP.

22) Leg uit hoe Cassandra gewijzigde gegevens in de commitlog schrijft?

  • Cassandra voegt gewijzigde gegevens samen tot commitlog
  • Commitlog fungeert als een crashherstellogboek voor gegevens
  • Totdat de gewijzigde gegevens zijn samengevoegd tot de commitlog-schrijfbewerking, wordt deze nooit als succesvol beschouwd

Gegevens gaan niet verloren zodra de commitlog naar het bestand is gewist

23) Leg uit hoe Cassandra gegevens verwijdert?

SSTables zijn onveranderlijk en kunnen geen rij uit SSTables verwijderen. Wanneer een rij moet worden verwijderd, wijst Cassandra de kolomwaarde toe met een speciale waarde genaamd Tombstone. Wanneer de gegevens worden gelezen, wordt de Tombstone-waarde als verwijderd beschouwd.