Che cos'è OLAP?
OLAP consente analisi dei dati multidimensionali veloci e flessibili per applicazioni di BI (business intelligence) e supporto decisionale nelle implementazioni di data warehousing
Sfondo nero e blu
Che cos'è OLAP?

OLAP (acronimo di  online analytical processing) è un software per eseguire analisi multidimensionali ad alta velocità su grandi volumi di dati da un data warehouse, un data mart o un altro archivio dati centralizzato unificato.

La maggior parte dei dati aziendali ha dimensioni multiple — più categorie in cui i dati sono suddivisi per la presentazione, il rilevamento o l'analisi. Ad esempio, i dati di vendita potrebbero avere diverse dimensioni legate alla posizione (regione, paese, stato/provincia, negozio), al tempo (anno, mese, settimana, giorno), al prodotto (abbigliamento, uomo/donna/bambino, marca, tipo) e altro ancora.

Ma in un data warehouse, i dataset sono archiviati in tabelle, ognuna delle quali può organizzare i dati in solo due dimensioni alla volta. OLAP estrae i dati da più dataset relazionali e li riorganizza in un formato multidimensionale che permette un'elaborazione molto veloce e un'analisi molto attenta. 

Che cos'è un cubo OLAP?

Il nucleo della maggior parte dei sistemi OLAP, il cubo OLAP è un database multidimensionale basato su array che rende possibile l'elaborazione e l'analisi di più dimensioni di dati in modo molto più rapido ed efficiente rispetto a un database relazionale tradizionale.

Una tabella di un database relazionale è strutturata come un foglio di calcolo e memorizza i singoli record in un formato bidimensionale, riga per colonna. Ogni "fatto" di dati nel database si trova all'intersezione di due dimensioni, una riga e una colonna, ad esempio regione e totale vendite.

SQL e gli strumenti di reporting dei database relazionali possono certamente eseguire query, riportare e analizzare i dati multidimensionali memorizzati in tabelle, ma le prestazioni rallentano con l'aumento dei volumi di dati. Riorganizzare i risultati per concentrarsi su diverse dimensioni richiede molto lavoro.

È qui che entra in gioco il cubo OLAP. Il cubo OLAP estende la singola tabella con livelli aggiuntivi, ognuno dei quali aggiunge ulteriori dimensioni, di solito il livello successivo nella "gerarchia dei concetti" della dimensione. Ad esempio, il livello superiore del cubo potrebbe organizzare le vendite per regione; i livelli aggiuntivi potrebbero essere paese, stato/provincia, città e anche negozio specifico.

In teoria, un cubo può contenere un numero infinito di livelli. (Un cubo OLAP che rappresenta più di tre dimensioni è talvolta chiamato ipercubo.) E cubi più piccoli possono esistere all'interno dei livelli — ad esempio, ogni livello del negozio potrebbe contenere cubi che organizzano le vendite per venditore e prodotto. In pratica, gli analisti di dati creano cubi OLAP contenenti proprio i livelli di cui hanno bisogno, per analisi e prestazioni ottimali. 

Drill-down

L'operazione di drill-down converte dati meno dettagliati in dati più dettagliati tramite uno dei due metodi: spostamento verso il basso nella gerarchia dei concetti o aggiunta di una nuova dimensione al cubo. Ad esempio, se si visualizzano i dati di vendita per il calendario o il trimestre fiscale di un'organizzazione, è possibile effettuare il drill-down per visualizzare le vendite per ogni mese, spostandosi verso il basso nella gerarchia dei concetti della dimensione "tempo".

Roll up

Il roll up è l'opposto della funzione drill-down: aggrega i dati su un cubo OLAP spostandosi verso l'alto nella gerarchia dei concetti o riducendo il numero di dimensioni. Ad esempio, si potrebbe salire nella gerarchia dei concetti della dimensione "località" visualizzando i dati di ogni paese, piuttosto che di ogni città.

Slice e dice

L'operazione slice crea un sotto-cubo selezionando una singola dimensione dal cubo OLAP principale. Ad esempio, è possibile eseguire una slice evidenziando tutti i dati per il primo trimestre fiscale o di calendario dell'organizzazione (dimensione temporale).

L'operazione dice isola un sotto-cubo selezionando diverse dimensioni all'interno del cubo OLAP principale. Ad esempio, è possibile eseguire un'operazione dice evidenziando tutti i dati in base ai trimestri di calendario o fiscali di un'organizzazione (dimensione temporale) e all'interno degli Stati Uniti e del Canada (dimensione geografica).

Pivot

La funzione pivot ruota la vista corrente del cubo per mostrare una nuova rappresentazione dei dati, consentendo viste dinamiche multidimensionali dei dati. La funzione pivot OLAP è paragonabile alla funzione della tabella pivot in un software di fogli di calcolo, come Microsoft Excel, ma mentre le tabelle pivot in Excel possono essere impegnative, i pivot OLAP sono relativamente più facili da usare (sono richieste meno competenze) e hanno un tempo di risposta e prestazioni di query più veloci.

Confronto tra MOLAP, ROLAP e HOLAP

OLAP che funziona direttamente con un cubo OLAP multidimensionale è noto come OLAP multidimensionale, o MOLAP. Anche in questo caso, per la maggior parte degli usi, MOLAP è il tipo di analisi dei dati multidimensionali più veloce e pratico.

Tuttavia, esistono altri due tipi di OLAP che possono essere preferibili in alcuni casi:

ROLAP

ROLAP, o OLAP relazionale,  è un'analisi dei dati multidimensionali che opera direttamente sui dati nelle tabelle relazionali, senza prima riorganizzare i dati in un cubo.

Come notato in precedenza, SQL è uno strumento perfettamente adatto per le query multidimensionali, il reporting e l'analisi. Ma le query SQL richieste sono complesse, le prestazioni possono peggiorare e la vista risultante dei dati è statica, non può essere ruotata per rappresentare una vista diversa dei dati. ROLAP è più adatto quando la capacità di lavorare direttamente con grandi quantità di dati è più importante delle prestazioni e della flessibilità.

HOLAP

HOLAP, o OLAP ibrido, tenta di creare la divisione ottimale del lavoro tra database relazionali e multidimensionali all'interno di una singola architettura OLAP. Le tabelle relazionali contengono maggiori quantità di dati e i cubi OLAP vengono utilizzati per aggregazioni ed elaborazione speculativa. HOLAP richiede un server OLAP che supporti sia MOLAP che ROLAP.

Uno strumento HOLAP può eseguire il "drill through" del cubo di dati alle tabelle relazionali, il che apre la strada all'elaborazione rapida dei dati e all'accesso flessibile. Questo sistema ibrido può offrire migliore scalabilità ma non può sfuggire all'inevitabile rallentamento quando si accede a origini di dati relazionali. Inoltre, la sua complessa architettura richiede in genere aggiornamenti e manutenzione più frequenti, poiché deve archiviare ed elaborare tutti i dati dai database relazionali e multidimensionali. Per questo motivo, HOLAP può finire per essere più costoso.

OLAP e OLTP

Online transaction processing, o OLTP, fa riferimento ai metodi di elaborazione dei dati e al software incentrato su dati e applicazioni orientati alle transazioni. 

La differenza principale tra OLAP e OLTP si evince dal nome: OLAP ha una natura analitica, mentre OLTP è transazionale. 

Gli strumenti OLAP sono progettati per l'analisi multidimensionale dei dati in un data warehouse, che contiene dati sia cronologici che transazionali. Infatti, un server OLAP è in genere il livello analitico intermedio di una soluzione di data warehousing. Gli usi comuni di OLAP includono il data mining e altre applicazioni di BI (business intelligence), complessi calcoli analitici e scenari predittivi, nonché funzioni di reportistica di business come l'analisi finanziaria e la pianificazione previsionale e di determinazione del budget.

OLTP è progettato per supportare le applicazioni orientate alle transazioni elaborando le transazioni recenti nel modo più rapido e accurato possibile. Gli usi comuni di OLTP includono bancomat, software di e-commerce, elaborazione dei pagamenti con carta di credito, prenotazioni online, sistemi di prenotazione e strumenti di conservazione di record.

Per un'analisi approfondita delle differenze tra questi approcci, consulta "Confronto tra OLAP e OLTP: qual è la differenza?"

OLAP e architettura cloud

OLAP permette alle aziende di massimizzare il potenziale dei loro dati aziendali trasformandoli nel formato più pratico per l'analisi multidimensionale. Questo, a sua volta, rende più facile discernere preziose informazioni aziendali. Tuttavia, se tali sistemi sono tenuti in-casa, si limita il potenziale di scalabilità.

I servizi OLAP basati sul cloud sono meno costosi e più facili da configurare, il che li rende più accattivanti per le piccole imprese o le startup con un budget limitato. Le imprese possono attingere al vasto potenziale dei data warehouse basati sul cloud che eseguono analisi sofisticate a velocità impareggiabili perché utilizzano l'elaborazione parallela massiccia (MPP). Pertanto, le aziende possono utilizzare OLAP alla velocità e alla scala del cloud, analizzando grandi quantità di dati senza spostarli dal loro data warehouse cloud.

Costance Hotels, Resorts & Golf è un gruppo di hotel di lusso con nove proprietà su isole nell'Oceano Indiano. Tuttavia, la mancanza di comunicazione tra le isole ha dato luogo a silos organizzativi, con dati aziendali isolati in ogni resort. L'organizzazione ha creato un data warehouse cloud e un'architettura analitica per collegare tutti i sistemi e gli strumenti on-premise con un repository di dati centrale basato sul cloud. In questo modo, l'azienda ha ottenuto le informazioni a livello di gruppo di cui aveva bisogno per sfruttare l'analitica avanzata e predittiva e implementare un sistema OLAP.

OLAP nell'architettura cloud è una soluzione veloce e conveniente costruita per il futuro. Una volta creati i cubi, i team possono utilizzare gli strumenti di business intelligence esistenti per connettersi istantaneamente con il modello OLAP e trarre informazioni interattive in tempo reale dai dati cloud.

Soluzioni correlate
IBM Db2 Warehouse on Cloud

IBM DB2 Warehouse on Cloud è un servizio cloud pubblico gestito. È possibile configurare IBM DB2 Warehouse on-premise con l'hardware o in un cloud privato.

Esplora IBM Db2 Warehouse on Cloud
Cubing Services

IBM DB2 Warehouse integra e semplifica l'ambiente del data warehouse fornendo un warehousing dinamico e garantendo un supporto diretto per OLAP nel data warehouse.

Esplora Cubing Services
Passa alla fase successiva

IBM Db2 Warehouse on Cloud è un servizio cloud pubblico gestito. È possibile configurare IBM Db2 Warehouse on-premise con il tuo hardware o in un cloud privato. Come un data warehouse, questo servizio include funzionalità come elaborazione dati in-memory e tabelle a colonne per OLAP (Online Analytical Processing). Poiché queste caratteristiche condividono un motore di database comune, è possibile ottimizzare o spostare facilmente i carichi di lavoro di dati.

Esplora IBM Db2 Warehouse on Cloud oggi stesso