Qu'est-ce que l'OLAP ?
L'OLAP permet une analyse rapide et flexible des données multidimensionnelles pour les applications de Business Intelligence (BI) et d'aide à la décision dans les implémentations d'entrepôts de données
Arrière-plan noir et bleu
Qu'est-ce que l'OLAP ?

Le traitement analytique en ligne, ou OLAP (Online Analytical Processing) est un logiciel permettant d'effectuer des analyses multidimensionnelles à grande vitesse sur de gros volumes de données provenant d'un entrepôt de données, d'un magasin de données ou d'un autre dépôt de données unifié et centralisé.

La plupart des données d'entreprise comportent plusieurs dimensions, c'est-à-dire plusieurs catégories dans lesquelles les données sont réparties à des fins de présentation, de suivi ou d'analyse. Par exemple, les chiffres des ventes peuvent avoir plusieurs dimensions liées à l'emplacement (région, pays, état/province, magasin), au temps (année, mois, semaine, jour), au produit (vêtements, hommes/femmes/enfants, marque, type), et plus encore.

Or, dans un entrepôt de données, les ensembles de données sont stockés dans des tableaux, dont chacun peut organiser les données selon seulement deux de ces dimensions à la fois. Le traitement analytique en ligne extrait les données de plusieurs ensembles de données relationnelles et les réorganise dans un format multidimensionnel qui permet un traitement très rapide et une analyse très poussée. 

Qu'est-ce qu'un cube OLAP ?

Au cœur de la plupart des systèmes OLAP, le cube OLAP est une base de données multidimensionnelle basée sur des tableaux qui permet de traiter et d'analyser des données multidimensionnelles beaucoup plus rapidement et efficacement qu'une base de données relationnelle traditionnelle.

Une table de base de données relationnelle est structurée comme une feuille de calcul. Elle stocke les enregistrements individuels dans un format bidimensionnel, en ligne par colonne. Chaque « fait » de données dans la base de données se trouve à l'intersection de deux dimensions (une ligne et une colonne), par exemple la région et le total des ventes.

Les outils de rapport SQL et les bases de données relationnelles peuvent certes interroger, rapporter et analyser des données multidimensionnelles stockées dans des tableaux, mais les performances diminuent lorsque les volumes de données augmentent. Et la réorganisation des résultats pour se concentrer sur différentes dimensions demande beaucoup de travail.

C'est là que le cube OLAP entre en jeu. Le cube OLAP étend le tableau unique avec des couches supplémentaires, chacune ajoutant des dimensions supplémentaires, généralement le niveau suivant dans la « hiérarchie des concepts » de la dimension. Par exemple, la couche supérieure du cube peut organiser les ventes par région ; les couches supplémentaires peuvent être le pays, l'état ou la province, la ville et même un magasin spécifique.

En théorie, un cube peut contenir un nombre infini de couches. (Un cube OLAP qui représente plus de trois dimensions est parfois appelé un cube multidimensionnel). De plus, des cubes plus petits peuvent exister au sein des couches. Par exemple, chaque couche de magasin peut contenir des cubes organisant les ventes par vendeur et par produit. Dans la pratique, les analystes de données créeront des cubes OLAP contenant uniquement les couches dont ils ont besoin afin d'optimiser l'analyse et les performances. 

Forage vers le bas (drill-down)

L'opération de forage vers le bas convertit des données moins détaillées en données plus détaillées en descendant dans la hiérarchie des concepts ou en ajoutant une nouvelle dimension au cube. Par exemple, si vous visualisez les données de ventes pour le calendrier ou le trimestre fiscal d'une organisation, vous pouvez effectuer une analyse descendante pour voir les ventes de chaque mois, en descendant dans la hiérarchie des concepts de la dimension « temps ».

Forage vers le haut (roll-up)

Le forage vers le haut est le contraire de la fonction de forage vers le bas. Il permet d'agréger les données d'un cube OLAP en remontant dans la hiérarchie des concepts ou en réduisant le nombre de dimensions. Par exemple, vous pouvez remonter dans l'arborescence de la dimension « emplacement » en visualisant les données de chaque pays, plutôt que de chaque ville.

Découpage en tranches et en dés (slice and dice)

L'opération de découpage en tranches crée un sous-cube en sélectionnant une seule dimension dans le cube OLAP principal. Par exemple, vous pouvez effectuer une tranche en mettant en évidence toutes les données du premier trimestre fiscal ou civil de l'organisation (dimension du temps).

L'opération de découpage en dés isole un sous-cube en sélectionnant plusieurs dimensions dans le cube OLAP principal. Par exemple, vous pouvez effectuer une opération de découpage en dés en mettant en évidence toutes les données par trimestre civil ou fiscal d'une organisation (dimension du temps) et aux États-Unis et au Canada (dimension de l'emplacement).

Pivot

La fonction de pivot fait pivoter la vue actuelle du cube pour afficher une nouvelle représentation des données afin d'obtenir des vues multidimensionnelles dynamiques des données. La fonction de pivot OLAP est comparable à la fonction de tableau croisé dynamique dans les tableurs, comme Microsoft Excel, mais alors que les tableaux croisés dynamiques dans Excel peuvent être difficiles à utiliser, les pivots OLAP sont plus simples à utiliser (moins d'expertise est nécessaire) et ont un temps de réponse et des performances de requête plus rapides.

MOLAP, ROLAP et HOLAP

Un traitement analytique en ligne qui fonctionne directement avec un cube OLAP multidimensionnel est appelé OLAP multidimensionnel, ou MOLAP. Encore une fois, pour la plupart des utilisations, le MOLAP est le type d'analyse de données multidimensionnelles le plus rapide et le plus pratique.

Cependant, deux autres types de traitements analytiques en ligne peuvent être préférables dans certains cas :

ROLAP

Le ROLAP, ou OLAP relationnel, est une analyse de données multidimensionnelles qui opère directement sur les données des tableaux relationnels, sans réorganiser au préalable les données dans un cube.

Comme nous l'avons indiqué précédemment, SQL est un outil parfaitement adapté aux requêtes, aux rapports et aux analyses multidimensionnels. Toutefois, les requêtes SQL requises sont complexes, les performances peuvent se dégrader et la vue des données qui en résulte est statique. Elle ne peut pas être pivotée pour représenter une vue différente des données. ROLAP est préférable quand la possibilité de travailler directement avec de grandes quantités de données est une priorité par rapport à la performance et à la flexibilité.

HOLAP

L'HOLAP, ou OLAP hybride, tente de créer la division optimale du travail entre les bases de données relationnelles et multidimensionnelles au sein d'une même architecture OLAP. Les tableaux relationnels contiennent de plus grandes quantités de données, et les cubes OLAP sont utilisés pour les agrégations et le traitement spéculatif. L'HOLAP nécessite un serveur OLAP qui prenne en charge à la fois MOLAP et ROLAP.

Un outil HOLAP peut "percer" le cube de données jusqu'aux tables relationnelles, ce qui permet un traitement rapide des données et un accès flexible. Ce système hybride peut offrir une meilleure évolutivité mais ne peut échapper à l'inévitable ralentissement lors de l'accès aux sources de données relationnelles. En outre, son architecture complexe nécessite généralement des mises à jour et une maintenance plus fréquentes, car il est nécessaire de stocker et de traiter toutes les données provenant de bases de données relationnelles et multidimensionnelles. Pour cette raison, l'HOLAP peut s'avérer plus cher.

OLAP et OLTP

Le traitement des transactions en ligne, ou OLTP, désigne les logiciels et les méthodes de traitement des données centrés sur des données et des applications orientées vers les transactions. 

La principale différence entre l'OLAP et l'OLTP est que l'OLAP est de nature analytique, tandis que l'OLTP est de nature transactionnelle. 

Les outils OLAP sont conçus pour l'analyse multidimensionnelle des données d'un entrepôt de données, qui contient à la fois des données historiques et des données transactionnelles. En effet, un serveur OLAP est généralement le niveau intermédiaire, analytique, d'une solution d'entreposage de données. Parmi les utilisations courantes de l'OLAP figurent l'exploration de données et d'autres applications d'aide à la décision, les calculs analytiques complexes et les scénarios prédictifs, ainsi que les fonctions de rapport d'activité telles que l'analyse financière, la budgétisation et la planification des prévisions.

L'OLTP est conçu pour prendre en charge les applications orientées sur les transactions en traitant les transactions récentes aussi rapidement et précisément que possible. Parmi les utilisations courantes de l'OLTP figurent les guichets automatiques, les logiciels de commerce électronique, le traitement des paiements par carte de crédit, les réservations en ligne, les systèmes de réservation et les outils d'archivage.

Pour obtenir une analyse approfondie des différences entre ces approches, consultez l'article « Différence entre l'OLAP et l'OLTP »

L'OLAP et l'architecture cloud

L'OLAP permet aux entreprises de maximiser le potentiel de leurs données d'entreprise en les transformant dans le format le plus pratique pour l'analyse multidimensionnelle. Cela leur permet ensuite de discerner plus facilement des informations commerciales. Cependant, si ces systèmes sont conservés en interne, le potentiel de mise à l'échelle est limité.

Les services OLAP basés dans le cloud sont moins chers et plus faciles à installer et configurer, ce qui les rend plus attrayants pour les petites entreprises ou les startups dont les budgets sont réduits. Les entreprises peuvent exploiter le vaste potentiel des entrepôts de données sur le cloud qui effectuent des analyses sophistiquées à des vitesses inégalées car ils utilisent un traitement à parallélisme massif (MPP). Par conséquent, elles peuvent utiliser l'OLAP à la vitesse et à l'échelle du cloud, en analysant de grandes quantités de données sans les déplacer de leur entrepôt de données stocké dans le cloud.

Le groupe Constance Hotels, Resorts & Golf est un groupe hôtelier de luxe qui exploite neuf propriétés sur des îles de l'océan Indien. Cependant, le manque de communication d'île en île a donné lieu à des situations d'isolement dans l'organisation, puisque les données commerciales étaient isolées dans chaque complexe. L'organisation a construit un entrepôt de données cloud et une architecture analytique pour relier tous les outils et systèmes locaux à un référentiel de données central basé dans le cloud. Grâce à l'analyse prédictive avancée et à la mise en œuvre d'un système OLAP, le groupe a obtenu la vision globale dont elle avait besoin.

L'OLAP dans une architecture cloud est une solution rapide et rentable construite pour l'avenir. Une fois les cubes créés, les équipes peuvent utiliser les outils d'aide à la décision existants pour se connecter instantanément au modèle OLAP et tirer des enseignements interactifs en temps réel de leurs données stockées dans le cloud.

Solutions connexes
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud est un service cloud public géré. Vous pouvez installer et configurer IBM Db2 Warehouse sur site avec votre propre matériel, ou dans un cloud privé.

Explorer IBM Db2 Warehouse on Cloud
Services de cubage

IBM Db2 Warehouse intègre et simplifie l'environnement de l'entrepôt de données en offrant un entreposage dynamique et en fournissant un support direct pour OLAP dans le cadre de l'entrepôt de données.

Explorer les services de cubage
Pour aller plus loin

IBM Db2 Warehouse on Cloud est un service de cloud public géré. Vous pouvez l'installer sur site avec votre propre matériel, ou dans un cloud privé. En tant qu'entrepôt de données, ce service comprend des fonctionnalités telles que le traitement des données en mémoire et des tableaux en colonnes pour le traitement analytique en ligne (OLAP). Comme ces fonctionnalités partagent un moteur de base de données commun, vous pouvez facilement optimiser ou déplacer les charges de travail des données.

Explorer IBM Db2 Warehouse on Cloud dès aujourd'hui