Cos'è OLAP?
Online Analytical Processing (OLAP) è una categoria di software che consente agli utenti di analizzare le informazioni da più sistemi di database contemporaneamente. È una tecnologia che consente agli analisti di estrarre e visualizzare i dati aziendali da diversi punti di vista.
Gli analisti hanno spesso bisogno di raggruppare, aggregare e unire i dati. Queste operazioni nei database relazionali richiedono molte risorse. Con OLAP i dati possono essere pre-calcolati e pre-aggregati, rendendo l'analisi più veloce.
I database OLAP sono divisi in uno o più cubi. I cubi sono progettati in modo tale che la creazione e la visualizzazione dei report diventino facili. OLAP è l'acronimo di Online Analytical Processing.
In questo tutorial imparerai-
- Cubo OLAP
- Operazioni analitiche di base di OLAP
- Tipi di sistemi OLAP
- ROLAP
- MOLAP
- OLAP ibrido
- Vantaggi di OLAP
- Svantaggi di OLAP
Cubo OLAP:
Al centro del concetto OLAP, c'è un cubo OLAP. Il cubo OLAP è una struttura dati ottimizzata per un'analisi dei dati molto rapida.
Il cubo OLAP è costituito da fatti numerici chiamati misure che sono classificati in base alle dimensioni. OLAP Cube è anche chiamato hypercube .
Di solito, le operazioni e l'analisi dei dati vengono eseguite utilizzando il semplice foglio di calcolo, in cui i valori dei dati sono disposti in formato riga e colonna. Questo è l'ideale per i dati bidimensionali. Tuttavia, OLAP contiene dati multidimensionali, con dati generalmente ottenuti da una fonte diversa e non correlata. L'utilizzo di un foglio di calcolo non è un'opzione ottimale. Il cubo può archiviare e analizzare dati multidimensionali in modo logico e ordinato.
Come funziona?
Un data warehouse estrae le informazioni da più origini dati e formati come file di testo, fogli Excel, file multimediali, ecc.
I dati estratti vengono puliti e trasformati. I dati vengono caricati in un server OLAP (o cubo OLAP) dove le informazioni vengono pre-calcolate in anticipo per ulteriori analisi.
Operazioni analitiche di base di OLAP
Quattro tipi di operazioni analitiche in OLAP sono:
- Roll-up
- Scavare a fondo
- Fare a pezzi
- Pivot (ruota)
1) Roll-up:
Il roll-up è anche noto come "consolidamento" o "aggregazione". L'operazione di roll-up può essere eseguita in 2 modi
- Ridurre le dimensioni
- Salendo la gerarchia dei concetti. La gerarchia dei concetti è un sistema di raggruppamento delle cose in base al loro ordine o livello.
Considera il diagramma seguente
- In questo esempio, le città New Jersey e Lost Angles sono state raggruppate nel paese USA
- Le cifre di vendita del New Jersey e di Los Angeles sono rispettivamente di 440 e 1560. Diventano 2000 dopo il roll-up
- In questo processo di aggregazione, i dati sono la gerarchia delle posizioni che si sposta dalla città al paese.
- Nel processo di roll-up è necessario rimuovere almeno una o più dimensioni. In questo esempio, la dimensione Quater viene rimossa.
2) Analisi dettagliata
Nel drill-down i dati vengono frammentati in parti più piccole. È l'opposto del processo di rollup. Può essere fatto tramite
- Scendendo nella gerarchia dei concetti
- Aumentare una dimensione
Considera il diagramma sopra
- Il primo trimestre del primo trimestre viene analizzato fino ai mesi di gennaio, febbraio e marzo. Anche le vendite corrispondenti sono registri.
- In questo esempio, vengono aggiunti i mesi di dimensione.
3) Fetta:
Qui viene selezionata una dimensione e viene creato un nuovo sottocubo.
Il diagramma seguente spiega come è stata eseguita l'operazione di slice:
- Dimension Time è sezionato con Q1 come filtro.
- Viene creato un nuovo cubo.
Dado:
Questa operazione è simile a una slice. La differenza nei dadi è che selezioni 2 o più dimensioni che si traducono nella creazione di un sottocubo.
4) Pivot
In Pivot, ruoti gli assi dei dati per fornire una presentazione sostitutiva dei dati.
Nell'esempio seguente, il pivot si basa sui tipi di elemento.
Tipi di sistemi OLAP
Struttura gerarchica OLAP
Tipo di OLAP | Spiegazione |
OLAP relazionale (ROLAP): | ROLAP è un RDBMS esteso insieme alla mappatura dei dati multidimensionali per eseguire l'operazione relazionale standard. |
OLAP multidimensionale (MOLAP) | MOLAP Implementa il funzionamento in dati multidimensionali. |
Elaborazione analitica online ibrida (HOLAP) | Nell'approccio HOLAP i totali aggregati sono archiviati in un database multidimensionale mentre i dati dettagliati sono archiviati nel database relazionale. Ciò offre sia l'efficienza dei dati del modello ROLAP che le prestazioni del modello MOLAP. |
Desktop OLAP (DOLAP) | In Desktop OLAP, un utente scarica una parte dei dati dal database localmente o sul proprio desktop e li analizza. DOLAP è relativamente più economico da implementare in quanto offre pochissime funzionalità rispetto ad altri sistemi OLAP. |
Web OLAP (WOLAP) | Web OLAP che è il sistema OLAP accessibile tramite il browser web. WOLAP è un'architettura a tre livelli. È costituito da tre componenti: client, middleware e un server di database. |
OLAP mobile: | Mobile OLAP aiuta gli utenti ad accedere e analizzare i dati OLAP utilizzando i propri dispositivi mobili |
OLAP spaziale: | SOLAP è stato creato per facilitare la gestione dei dati spaziali e non in un sistema di informazione geografica (GIS) |
ROLAP
ROLAP funziona con i dati che esistono in un database relazionale. I fatti e le tabelle delle dimensioni vengono archiviati come tabelle relazionali. Consente inoltre l'analisi multidimensionale dei dati ed è l'OLAP in più rapida crescita.
Vantaggi del modello ROLAP:
- Elevata efficienza dei dati. Offre un'elevata efficienza dei dati perché le prestazioni delle query e il linguaggio di accesso sono ottimizzati in particolare per l'analisi dei dati multidimensionali.
- Scalabilità. Questo tipo di sistema OLAP offre scalabilità per la gestione di grandi volumi di dati e anche quando i dati sono in costante aumento.
Svantaggi del modello ROLAP:
- Domanda di risorse più elevate: ROLAP richiede un elevato utilizzo di risorse umane, software e hardware.
- Limitazioni dei dati aggregati. Gli strumenti ROLAP utilizzano SQL per tutti i calcoli dei dati aggregati. Tuttavia, non ci sono limiti fissati per la gestione dei calcoli.
- Prestazioni lente delle query. Le prestazioni delle query in questo modello sono lente rispetto a MOLAP
MOLAP
MOLAP utilizza motori di archiviazione multidimensionale basati su array per visualizzare viste multidimensionali dei dati. Fondamentalmente, usano un cubo OLAP.
Ulteriori informazioni su OLAP qui
OLAP ibrido
OLAP ibrido è una miscela di ROLAP e MOLAP. Offre un calcolo rapido di MOLAP e una maggiore scalabilità di ROLAP. HOLAP utilizza due database.
- I dati aggregati o calcolati vengono archiviati in un cubo OLAP multidimensionale
- Le informazioni dettagliate vengono archiviate in un database relazionale.
Vantaggi di Hybrid OLAP:
- Questo tipo di OLAP aiuta a risparmiare spazio su disco e rimane anche compatto, il che aiuta a evitare problemi legati alla velocità di accesso e alla praticità.
- L'HOLAP ibrido utilizza la tecnologia del cubo che consente prestazioni più veloci per tutti i tipi di dati.
- I ROLAP vengono aggiornati istantaneamente e gli utenti HOLAP hanno accesso a questi dati aggiornati istantaneamente in tempo reale. MOLAP porta la pulizia e la conversione dei dati migliorando così la pertinenza dei dati. Questo porta il meglio di entrambi i mondi.
Svantaggi dell'OLAP ibrido:
- Livello di complessità maggiore : il principale svantaggio dei sistemi HOLAP è che supporta sia gli strumenti che le applicazioni ROLAP e MOLAP. Quindi è molto complicato.
- Potenziali sovrapposizioni : ci sono maggiori possibilità di sovrapposizione soprattutto nelle loro funzionalità.
Vantaggi di OLAP
- OLAP è una piattaforma per tutti i tipi di attività, inclusi pianificazione, budget, reportistica e analisi.
- Informazioni e calcoli sono coerenti in un cubo OLAP. Questo è un vantaggio fondamentale.
- Crea e analizza rapidamente scenari "What if"
- Cerca facilmente nel database OLAP termini generici o specifici.
- OLAP fornisce gli elementi costitutivi per strumenti di modellazione aziendale, strumenti di data mining, strumenti di reporting delle prestazioni.
- Consente agli utenti di suddividere e suddividere i dati del cubo in base a varie dimensioni, misure e filtri.
- È utile per analizzare le serie temporali.
- Trovare alcuni cluster e valori anomali è facile con OLAP.
- È un potente sistema di elaborazione analitica in linea di visualizzazione che fornisce tempi di risposta più rapidi
Svantaggi di OLAP
- OLAP richiede l'organizzazione dei dati in uno schema a stella o fiocco di neve. Questi schemi sono complicati da implementare e amministrare
- Non è possibile avere un numero elevato di dimensioni in un singolo cubo OLAP
- Non è possibile accedere ai dati transazionali con il sistema OLAP.
- Qualsiasi modifica in un cubo OLAP richiede un aggiornamento completo del cubo. Questo è un processo che richiede tempo
Sommario:
- OLAP è una tecnologia che consente agli analisti di estrarre e visualizzare i dati aziendali da diversi punti di vista.
- Al centro del concetto OLAP, c'è un cubo OLAP.
- Diverse applicazioni aziendali e altre operazioni sui dati richiedono l'uso di OLAP Cube.
- Esistono cinque tipi principali di operazioni analitiche in OLAP 1) Roll-up 2) Drill-down 3) Slice 4) Dice e 5) Pivot
- Tre tipi di sistemi OLAP ampiamente utilizzati sono MOLAP, ROLAP e Hybrid OLAP.
- Desktop OLAP, Web OLAP e Mobile OLAP sono altri tipi di sistemi OLAP.