Top 40 domande e risposte ai colloqui di ElasticSearch

Ecco le domande del colloquio di ricerca elastica per candidati più freschi ed esperti.

1) Cos'è Elasticsearch?

Elasticsearch è un database NoSQL. Si basa sul motore di ricerca Lucene ed è costruito con RESTful APIS. Offre una semplice implementazione, la massima affidabilità e una facile gestione. Fornisce inoltre query avanzate per eseguire analisi dettagliate e archivia tutti i dati centralmente. Aiuta ad eseguire una rapida ricerca dei documenti.

2) Quali sono le caratteristiche importanti di Elasticsearch?

Ecco le caratteristiche importanti di Elasticsearch:

Un server di ricerca open source scritto utilizzando Java.
Utilizzato per indicizzare qualsiasi tipo di dati eterogenei
Ha un'interfaccia web API REST con output JSON
Ricerca full-text
Ricerca Near Real-Time (NRT)
Archivio documenti JSON frammentato, replicato ricercabile.
Archivio documenti distribuito senza schemi, basato su REST e JSON
Supporto multilingua e geolocalizzazione

3) Cos'è un cluster?

Un cluster è una raccolta di nodi che insieme contengono dati e forniscono funzionalità di indicizzazione e ricerca unite.

4) Spiegare l'indice

Un nodo è un'istanza di ricerca elastica. Viene creato quando inizia un'istanza di elasticsearch.

5) Che cos'è un documento in Elastic Search?

In una ricerca elastica, un documento è un'unità di informazioni di base che può essere indicizzata. È espresso in coppia JSON (chiave: valore). '{"utente": "nullcon"}'. Ad ogni singolo Documento è associato un tipo e un ID univoco.

6) Definisci il termine Shard

Ogni indice può essere suddiviso in più frammenti per poter distribuire i dati. Lo shard è la parte atomica di un indice, che può essere distribuito nel cluster se vuoi aggiungere più nodi.

7) Quali sono gli importanti vantaggi di Elastic Search?

Ecco gli importanti vantaggi di Elasticsearch:

Archivia i dati senza schema e crea anche uno schema per i tuoi dati.
Manipola il tuo record di dati per record con l'aiuto delle API multi-documento
Esegui il filtraggio e l'esecuzione di query sui dati per ottenere approfondimenti
Basato su Apache Lucene e fornisce API RESTful
Fornisce scalabilità orizzontale, affidabilità e funzionalità multi-tenant per l'utilizzo in tempo reale dell'indicizzazione.
Ti aiuta a ridimensionare verticalmente e orizzontalmente

8) Cos'è lo stack ELK?

ELK Stack è una raccolta di tre prodotti open source: Elasticsearch, Logstash e Kibana. Sono tutti sviluppati, gestiti e mantenuti dalla società Elastic.

E sta per ElasticSearch : viene utilizzato per memorizzare i log.
L sta per LogStash: viene utilizzato sia per la spedizione che per l'elaborazione e l'archiviazione dei registri.
K sta per Kibana: è uno strumento di visualizzazione (un'interfaccia web) ospitato tramite Nginx o Apache.

9) Spiegare l'architettura dello stack ELK

ELK Stack è progettato per consentire agli utenti di accedere ai dati da qualsiasi fonte, in qualsiasi formato e di cercare, analizzare e visualizzare tali dati in tempo reale.

Registri: vengono identificati i registri del server che devono essere analizzati
Logstash: raccoglie i registri e i dati degli eventi. Analizza e trasforma anche i dati.
ElasticSearch: i dati trasformati da Logstash sono Store, Cerca e indicizzati.
Kibana: Kibana utilizza Elasticsearch DB per esplorare, visualizzare e condividere

10) Quali sono i motivi per utilizzare lo stack ELK?

Ecco i motivi per utilizzare lo stack ELK:

ELK funziona al meglio quando i registri di varie app di un'azienda convergono in una singola istanza ELK
Fornisce informazioni straordinarie per questa singola istanza ed elimina anche la necessità di accedere a un centinaio di origini dati di registro diverse.
Rapida installazione in sede
Bilancia facile da distribuire verticalmente e orizzontalmente
Elastic offre una serie di client linguistici, che include Ruby. Pitone. PHP, Perl, .NET, Java e JavaScript e altro ancora
Disponibilità di librerie per diversi linguaggi di programmazione e scripting

11) Spiega Tokenizer in ElasticSearch

Un Tokenizer suddivide i campi dei valori di un documento in un flusso. Gli indici invertiti vengono creati e aggiornati utilizzando questi valori. Successivamente, questi flussi di valori vengono memorizzati nel documento.

12) Cos'è una replica in ElasticSearch?

Ogni frammento in ElasticSearch ha 2 copie, chiamate repliche. Ti aiutano per l'alta disponibilità e la tolleranza agli errori.

13) Quali sono le operazioni principali che è possibile eseguire su un documento?

Di seguito sono riportate importanti operazioni eseguite sui documenti:

Indicizzazione di un documento
Recupero documenti
Aggiornamento dei documenti
Eliminazione di documenti

14) Cos'è un cluster in Elasticsearch?

Il cluster è una raccolta di uno o più nodi che contiene tutti i tuoi dati e offre capacità di indicizzazione e ricerca federate su tutti i nodi.

15) Come puoi eliminare un indice nella ricerca elastica?

Per eliminare un indice in Elasticsearch, è necessario scrivere il comando:

 DELETE /index name.

Ad esempio, DELETE / website.

16) Spiegare il metodo per aggiungere una mappatura in un Indice

Elasticsearch consente di creare la mappatura in base ai dati forniti dall'utente nel corpo della richiesta. La sua funzionalità in blocco può essere utilizzata per aggiungere più di un oggetto JSON nell'indice.

Ad esempio, POST website / _bulk.

17) Quali sono i vari modi di ricerca in Elasticsearch?

Di seguito sono riportate le modalità di ricerca in Elasticsearch:

Ricerca multi-indice, multi-tipo: è possibile cercare API che possono essere applicate a tutti gli indici multipli utilizzando il sistema di supporto multi-indice.

Nella ricerca elastica, possiamo creare determinati tag in tutti gli indici in tutti gli indici e tutti i tipi.

Ricerca URI: una richiesta di ricerca viene eseguita utilizzando un URI fornendo i parametri richiesti.
Richiesta di ricerca del corpo: una richiesta di ricerca deve essere eseguita da un DSL di ricerca. Include la query DSL all'interno del corpo.

18) Qual è l'ultima versione di Elasticsearch?

L'ultima versione di Elastic Search a gennaio 2020, che è l'ultima e stabile versione di Elasticsearch.

19) Cos'è la mappatura?

La mappatura è un processo che ti aiuta a definire come un documento viene mappato sul motore di ricerca. Le sue caratteristiche ricercabili sono inclusi i campi sono tokenizzati e ricercabili.

20) Dove viene archiviata la ricerca elastica?

Puoi archiviare Elasticsearch è un documento distribuito, ovvero un negozio con vari tipi di directory. È inoltre possibile recuperare le complesse strutture di dati che possono essere serializzate come documenti JSON.

21) Cos'è Apache Lucene?

Apache Lucene è una libreria software open source per il recupero delle informazioni. È originariamente scritto in linguaggio Java.

22) Ecco alcuni importanti strumenti di gestione della configurazione supportati da Elasticsearch:

Puppet - puppet-elasticsearch
Chef - ricettario-elasticsearch
Ansible - ricerca ansible-elastica

23) Cos'è NRT in Elasticsearch?

NRT è una forma completa di piattaforma (Near Real-Time Search). È una piattaforma di ricerca quasi in tempo reale. Significa che c'è una leggera latenza (principalmente un secondo) da quando si indicizza un documento fino a quando non diventa molto ricercabile.

24) Dove si configurano le impostazioni per X-Pack?

È possibile configurare le impostazioni per X-Pack. Ha funzionalità nei file di configurazione elasticsearch, logstash e kibana.yml (stack ELK).

25) Cos'è l'API cat in Elasticsearch?

Questi comandi accettano un parametro della stringa di query. Questo aiuta a vedere tutte le informazioni, le intestazioni e le informazioni fornite e il comando / _cat, che consente di elencare tutti i comandi disponibili.

26) Quali sono i vari comandi disponibili nell'API cat di Elasticsearch?

I comandi che utilizzano con l'API cat sono:

Alias dei gatti, allocazione dei gatti, conteggio dei gatti, dati del campo dei gatti
Salute del gatto, indici del gatto, maestro del gatto, attività in sospeso, plugin per gatti, recupero del gatto
repository di gatti, istantanee di gatti, modelli di gatti

27) Cos'è il nodo Ingest?

Il nodo di importazione viene utilizzato per i documenti pre-elaborazione prima che avvenga l'effettiva indicizzazione del documento. Ti aiuta a intercettare le richieste di massa e indicizzare. Applica anche le trasformazioni e quindi ritrasmette i documenti all'API e all'indice in blocco.

28) Quali sono i vari modi di usare i comandi di X-Pack?

Ecco i comandi X-Pack che ti aiutano a configurare la sicurezza:

Certgen
migrare
syskeygen
certutil
saml-metadata
password di configurazione
utenti

29) Cosa sono le API per documento singolo in Elasticsearch?

Ottieni API
API Index
Elimina API
Aggiorna API

30) Spiega l'API Explore in Elasticsearch

L'API di esplorazione del grafico consente di estrarre e riepilogare le informazioni relative ai documenti.

31) Come puoi creare un indice in Elasticsearch?

Per esempio:

PUT / client? Carino

GET / _cat / indices? V

32) Cosa sono le aggregazioni?

Il framework delle aggregazioni ti aiuta a fornire dati aggregati in base a una query di ricerca. Si basa su semplici elementi costitutivi noti come aggregazioni. Può essere composto per creare riepiloghi complessi dei dati.

33) Elasticsearch ha uno schema?

Mappature ElasticSearch che possono essere utilizzate per applicare uno schema ai documenti.

34) Che cos'è Query DSL in Elasticsearch?

Elasticsearch offre query DSL (Domain Specific Language) complete basate su JSON per definire le query.

35) Cos'è Elasticsearch Data Node?

I nodi di dati contengono frammenti che gestiscono documenti indicizzati. Ti aiutano a eseguire CRUD relativi ai dati e operazioni di aggregazione di ricerca, ecc. Tuttavia, è necessario impostare node.data = true per rendere node come Data Node.

36) Cos'è un documento in ElasticSearch?

Il documento è molto simile a una riga nei database relazionali. Ogni documento nell'indice possiede una struttura diversa ma ha lo stesso tipo di dati per i rispettivi campi.

MySQL => Database => Tabelle => Colonne / Righe

ElasticSearch => Indici => Tipi => Documenti con proprietà

37) Spiegare il tipo in ElasticSearch

Il tipo è una partizione di indice logico la cui semantica dipende dall'utente.

38) Qual è il linguaggio di query di Elasticsearch?

Il linguaggio di query Apache Lucene, noto anche come Query DSL, viene utilizzato da Elasticsearch.

39) Cos'è la mappatura dinamica in Elasticsearch?

La mappatura dinamica aiuta l'utente a indicizzare i documenti senza configurazioni indesiderate per il nome del campo. Invece, verrà aggiunto automaticamente tramite Elasticsearch con alcune regole personalizzate.

40) Che cos'è la ricerca fuzzy Elasticsearch?

La ricerca fuzzy è un processo in cui devono essere identificate le posizioni dei documenti delle pagine web. Questo è simile all'argomento di ricerca. Funziona anche quando l'argomento non è rilevante per il corrispondente di ricerca per informazioni particolari.