Scarica il pdf
1) Come definisci Teradata? Dare alcune delle caratteristiche primarie dello stesso.
Teradata è fondamentalmente un RDMS che viene utilizzato per pilotare Datamart, Datawarehouse, OLAP, OLTP e DSS Appliance dell'azienda. Di seguito sono riportate alcune delle caratteristiche principali di Teradata.
- È in grado di funzionare su nodi singoli e multi-nodi.
- Il parallelismo è integrato nel sistema.
- Molto compatibile con gli standard ANSI.
- Tende ad agire allo stesso modo di un server.
- È un sistema aperto che funziona fondamentalmente per UNIX MR-RAS, Suse Linux ETC, WIN2K, ecc.
2) Quali sono le nuove funzionalità di Teradata?
Alcune delle nuove funzionalità di Teradata sono: -
- Analisi temporale automatizzata
- Estensione delle capacità di compressione che consente una compressione flessibile dei dati circa 20 volte più dati rispetto alla versione precedente.
- Innovazione associata al cliente come il punto di vista dei tetradati.
3) Evidenzia alcuni dei componenti importanti di Teradata.
Alcuni dei componenti importanti di Teradata sono: -
- Bynet
- Processore del modulo di accesso (AMP)
- Motore di analisi (PE)
- Disco virtuale (disco virtuale)
- Sistema di archiviazione virtuale (VSS)
4) Indicare la procedura tramite la quale possiamo eseguire lavori Teradata in ambiente UNIX.
Tutto quello che devi fare è eseguire l'esecuzione in UNIX nel modo indicato di seguito.
$ Sh> BTEQ <[Script Path]> [Logfile Path]
o
$ Sh> BTEQ <[Script Path] TEE [Logfile Path]
5) In Teradata, come generiamo la sequenza?
In Teradata, generiamo sequenza utilizzando la colonna Identity
6) Durante il tempo di visualizzazione, come viene generata la sequenza da Teradata?
Tutto quello che devi fare è usare CSUM.
7) Un certo carico viene imposto sul tavolo e anche quello, ogni ora. Il traffico mattutino è relativamente basso e quello notturno molto alto. In questa situazione, qual è l'utilità più consigliabile e come dovrebbe essere caricata l'utilità?
L'utilità più suggestionabile qui deve essere Tpump. Facendo uso della dimensione del pacchetto che diminuisce o aumenta, il traffico può essere facilmente gestito.
8) Se Fast Load Script non riesce e vengono rese disponibili solo le tabelle degli errori, come si riavvia?
Esistono fondamentalmente due modi per riavviare in questo caso.
- Eseguire il vecchio file: assicurarsi di non eliminare completamente le tabelle degli errori. Invece, prova a correggere gli errori presenti nello script o nel file e quindi esegui di nuovo.
- Esecuzione di un nuovo file: in questo processo, lo script viene eseguito semplicemente utilizzando le istruzioni di fine caricamento e inizio. Questo aiuterà a rimuovere il blocco che è stato messo sulla tabella di destinazione e potrebbe anche rimuovere il record dato dalla tabella di log veloce. Fatto ciò, sei libero di eseguire nuovamente l'intero script.
9) Cita alcuni degli strumenti ETL che rientrano in Teradata.
Alcuni degli strumenti ETL comunemente utilizzati in Teradata sono DataStage, Informatica, SSIS, ecc.
10) Evidenzia alcuni dei vantaggi che gli strumenti ETL hanno rispetto a TD.
Alcuni dei vantaggi che gli strumenti ETL hanno rispetto a TD sono: -
- È possibile utilizzare più destinazioni eterogenee e sorgenti.
- Il processo di debug è molto più semplice con l'aiuto degli strumenti ETL grazie al supporto completo della GUI.
- I componenti degli strumenti ETL possono essere facilmente riutilizzati e, di conseguenza, se c'è un aggiornamento al server principale, tutte le applicazioni corrispondenti connesse al server vengono aggiornate automaticamente.
- Il de-pivot e il pivot possono essere facilmente eseguiti utilizzando gli strumenti ETL.
11) Qual è il significato della memorizzazione nella cache in Teradata?
La memorizzazione nella cache è considerata un ulteriore vantaggio dell'utilizzo di Teradata poiché funziona principalmente con la sorgente che rimane nello stesso ordine, ovvero non cambia su base frequente. A volte, la cache è solitamente condivisa tra le applicazioni.
12) Come possiamo controllare la versione di Teradata che stiamo utilizzando attualmente?
Basta dare il comando .SHOW VERSION.
13) Fornire una ragione giustificabile per cui Multi-load supporta NUSI invece di USI.
La riga della sotto-tabella dell'indice si trova sullo stesso Amp allo stesso modo della riga dei dati in NUSI. Pertanto, ogni Amp viene azionato separatamente e in modo parallelo.
14) Come viene riavviato il sistema client MLOAD dopo l'esecuzione?
Lo script deve essere inviato manualmente in modo che possa caricare facilmente i dati dal checkpoint che arriva per ultimo.
15) Come viene riavviato MLOAD Teradata Server dopo l'esecuzione?
Il processo viene sostanzialmente eseguito dall'ultimo checkpoint noto e una volta che i dati sono stati eseguiti dopo l'esecuzione dello script MLOAD, il server viene riavviato.
16) Cosa si intende per nodo?
Un nodo è fondamentalmente definito come un assortimento di componenti di hardware e software. Di solito un server viene indicato come un nodo.
17) Supponiamo che ci sia un file che consiste di 100 record di cui dobbiamo saltare il primo e gli ultimi 20 record. Quale sarà lo snippet di codice?
Dobbiamo utilizzare BTEQ Utility per eseguire questa operazione. Skip 20 e Repeat 60 verranno utilizzati nello script.
18) Spiega la PDE.
PDE sta sostanzialmente per Parallel Data Extension. La PDE fondamentalmente è uno strato di interfaccia del software presente sopra il sistema operativo e offre al database la possibilità di operare in un ambiente parallelo.
19) Cos'è TPD?
TPD sta sostanzialmente per Trusted Parallel Database e funziona fondamentalmente con PDE. Teradata sembra essere un database che funziona principalmente con PDE. Questo è il motivo per cui Teradata viene solitamente definito database Trusted Parallel o Pure Parallel.
20) Cosa si intende per Channel Driver?
Un driver di canale è un software che funge da mezzo di comunicazione tra i PE e tutte le applicazioni in esecuzione sui canali collegati ai client.
21) Cosa si intende per Teradata Gateway?
Proprio come il driver di canale, Teradata Gateway funge da mezzo di comunicazione tra il motore di analisi e le applicazioni collegate ai client di rete. Viene assegnato un solo gateway per nodo.
22) Cosa si intende per disco virtuale?
Virtual Disk è fondamentalmente una raccolta di un'intera gamma di cilindri che sono dischi fisici. A volte viene indicato come array di dischi.
23) Spiegare il significato di Amp?
Amp fondamentalmente sta per Access Module Processor e sembra essere un processore che funziona virtualmente ed è fondamentalmente utilizzato per la gestione di una singola parte del database. Questa particolare porzione di database non può essere condivisa da nessun altro Amp. Pertanto, questa forma di architettura viene comunemente definita architettura del nulla condiviso.
24) Cosa contiene Amp e quali sono tutte le operazioni che esegue?
Fondamentalmente Amp consiste in un sottosistema di gestione database ed è in grado di eseguire le operazioni menzionate di seguito.
- Esecuzione di DML
- Esecuzione di DDL
- Implementazione di aggregazioni e join.
- Rilascio e applicazione di serrature, ecc.
25) Cosa si intende per Parsing Engine?
PE sembra essere un gentile Vproc. La sua funzione principale è accettare richieste SQL e fornire risposte in SQL. Consiste in una vasta gamma di componenti software che vengono utilizzati per suddividere SQL in vari passaggi e quindi inviarli agli AMP.
26) Cosa intendi per parsing?
L'analisi è un processo relativo all'analisi dei simboli di stringhe che sono in linguaggio informatico o in linguaggio naturale.
27) Quali sono le funzioni di un parser?
A Parser: -
- Controlla gli errori semantici
- Controlla gli errori sintattici
- Verifica l'esistenza dell'oggetto
28) Cosa si intende per dispatcher?
Dispatcher prende un'intera raccolta di richieste e quindi le conserva in una coda. La stessa coda viene mantenuta durante tutto il processo per fornire più serie di risposte.
29) Quante sessioni di MAX PE è in grado di gestire in un determinato momento?
PE può gestire un totale di 120 sessioni in un determinato momento.
30) Spiega BYNET.
BYNET serve fondamentalmente come mezzo di comunicazione tra i componenti. È principalmente responsabile per l'invio di messaggi e anche per l'esecuzione di operazioni di unione e ordinamento.
31) Cosa si intende per Clique?
Una Clique è fondamentalmente nota per essere un assortimento di nodi che viene condiviso tra le unità disco comuni. La presenza di Clique è estremamente importante poiché aiuta a evitare guasti ai nodi.
32) Cosa succede quando un nodo subisce una caduta?
Ogni volta che si verifica un calo del livello di prestazioni di un nodo, tutti i Vproc corrispondenti migrano immediatamente a un nuovo nodo dal nodo guasto per recuperare tutti i dati dalle unità comuni.
33) Elenca tutte le forme di BLOCCHI disponibili in Teradata.
Esistono fondamentalmente quattro tipi di SERRATURE che rientrano in Teradata. Questi sono: -
- Leggi Lock
- Blocco di accesso
- Blocco esclusivo
- Scrivi Lock
34) Qual è il livello specifico designato al quale può essere applicato un LOCK a Teradata?
- Livello tabella: tutte le righe presenti all'interno di una tabella verranno sicuramente bloccate.
- Blocco a livello di database: tutti gli oggetti presenti all'interno del database verranno bloccati.
- Blocco livello hash riga: verranno bloccate solo le righe corrispondenti alla riga specifica.
35) Nell'indice primario, qual è il punteggio degli AMP coinvolti attivamente?
Solo un AMP è attivamente coinvolto in un indice primario.
36) In Teradata, qual è il significato del comando UPSERT?
UPSERT sta sostanzialmente per Update Else Insert. Questa opzione è disponibile solo in Teradata.
37) Evidenziare i vantaggi del PPI (Partition Primary Index).
Il PPI viene utilizzato fondamentalmente per scopi di archiviazione dei dati basati su intervallo o su categoria. Quando si tratta di query Intervallo, non è necessario utilizzare la scansione completa della tabella poiché si sposta immediatamente nella partizione conseguente, saltando così tutte le altre partizioni.
38) Fornire le dimensioni di SMALLINT, BYTEINT e INTEGER.
SMALLINT - 2 byte - 16 bit -> da -32768 a 32767
BYTEINT - 1 byte - 8 bit -> da -128 a 127
INTERO - 4 byte - 32 bit -> da -2.147.483.648 a 2.147.483.647
39) Cosa si intende per piano a costi minimi?
Fondamentalmente un piano a costo minimo viene eseguito in meno tempo lungo il percorso più breve.
40) Evidenzia i punti di differenza tra il database e l'utente in Teradata.
- Un database è fondamentalmente passivo, mentre un utente è attivo.
- Un database memorizza principalmente tutti gli oggetti del database, mentre un utente può memorizzare qualsiasi oggetto sia che si tratti di una macro, di una tabella, di una vista, ecc.
- Il database non ha la password mentre l'utente deve inserire la password.
41) Evidenzia le differenze tra Chiave primaria e Indice primario.
- L'indice primario è abbastanza obbligatorio, mentre la chiave primaria è facoltativa.
- L'indice primario ha un limite di 64 tabelle / colonne, mentre la chiave primaria non ha alcun limite.
- L'indice primario consente duplicati e valori nulli, mentre la chiave primaria no.
- L'indice primario è un meccanismo fisico, mentre la chiave primaria è un meccanismo puramente logico.
42) Spiegare come viene utilizzato lo spazio di spool.
Lo spazio di spool in Teradata viene utilizzato fondamentalmente per l'esecuzione di query. Dello spazio totale disponibile in Teradata, il 20% dello spazio è sostanzialmente assegnato allo spazio di spool.
43) Evidenzia la necessità di Performance Tuning.
L'ottimizzazione delle prestazioni in Teradata viene fondamentalmente eseguita per identificare tutti i colli di bottiglia e quindi risolverli.
44) Commenta se il collo di bottiglia è un errore o meno.
Tecnicamente, il collo di bottiglia non è una forma di errore, ma certamente causa un certo ritardo nel sistema.
45) Come si possono identificare i colli di bottiglia?
Esistono fondamentalmente quattro modi per identificare un collo di bottiglia. Questi sono: -
- Spiegazione visiva di Teradata
- Spiega il modificatore di richiesta
- Teradata Manager
- Monitoraggio delle prestazioni
46) Cosa si intende per Piano dei costi più elevati?
Secondo il piano dei costi più elevati, il tempo necessario per eseguire il processo è maggiore e richiede il percorso più lungo disponibile.
47) Evidenzia tutte le modalità presenti sotto Livello di fiducia.
Basso, No, Alto e Partecipa sono le quattro modalità presenti in Livello di fiducia.
48) Assegna un nome alle cinque fasi che rientrano in MultiLoad Utility.
Fase preliminare, fase DML, fase di acquisizione dati, fase di applicazione e fase finale.
49) Evidenzia i limiti di TPUMP Utility.
Di seguito sono riportati i limiti dell'utilità TPUMP: -
- Non è possibile utilizzare l'istruzione SELECT.
- I file di dati non possono essere concatenati.
- Gli operatori aggregati ed esponenziali non sono supportati.
- Le funzioni aritmetiche non possono essere supportate.
50) In BTEQ, come vengono impostati i parametri della modalità di sessione?
.set session transaction BTET -> modalità di transazione Teradata
.set sessione transazione ANSI -> modalità ANSI
Questi comandi funzioneranno solo quando vengono immessi prima di accedere alla sessione.