Qu’est-ce que l’OLAP (traitement analytique en ligne) ?

Qu’est-ce que l’OLAP ?

L’OLAP, ou traitement analytique en ligne, est une technologie qui permet d’effectuer à grande vitesse des requêtes complexes ou des analyses multidimensionnelles sur de grands volumes de données dans un entrepôt de données, un data lake ou un autre référentiel de données. L’OLAP est utilisé dans la business intelligence (BI), l’aide à la décision et dans diverses applications de prévision et de production de rapports d’entreprise.

La plupart des données d’entreprise ont plusieurs dimensions, c’est-à-dire plusieurs catégories dans lesquelles elles sont décomposées à des fins de présentation, de suivi ou d’analyse. Par exemple, les chiffres de vente peuvent avoir plusieurs dimensions liées au lieu (région, pays, état/province, magasin), à la période (année, mois, semaine, jour), au produit (vêtements, hommes/femmes/enfants, marque, type, et plus encore.

Mais dans un entrepôt de données ou un data lake, les jeux de données sont stockés dans des tables, chacune d’entre elles pouvant organiser les données selon seulement deux de ces dimensions à la fois. L’OLAP extrait les données de plusieurs ensembles de données relationnelles et les réorganise dans un format multidimensionnel qui permet un traitement très rapide et une analyse génératrice d’informations.

Les dernières actualités technologiques, étayées par des avis d’experts

Restez au fait des tendances les plus étonnantes du secteur dans le domaine de l’IA, de l’automatisation, des données et bien d’autres avec la newsletter Think. Consultez la Déclaration de confidentialité d’IBM.

Qu’est-ce qu’un cube OLAP ?

Élément central de la plupart des systèmes OLAP, le cube OLAP est une base de données multidimensionnelle organisée en tables qui permet de traiter et d’analyser plusieurs dimensions de données beaucoup plus rapidement et efficacement qu’une base de données relationnelle.

Une table de base de données relationnelle est structurée comme une feuille de calcul et stocke des enregistrements individuels dans un format bidimensionnel (ligne et colonne). Chaque « fait » de donnée de la base de données se trouve à l’intersection de deux dimensions (une ligne et une colonne), qui peuvent être par exemple la région et les ventes totales.

Les outils de reporting SQL et de base de données relationnelle peuvent certes interroger, rapporter et analyser des données multidimensionnelles stockées dans des tables, mais les performances ralentissent à mesure que les volumes de données augmentent. Et il faut beaucoup de travail pour réorganiser les résultats de manière à se focaliser sur différentes dimensions.

C’est là qu’intervient le cube OLAP. Le cube OLAP étend la table avec des couches supplémentaires, chacune ajoutant des dimensions supplémentaires, généralement le niveau suivant dans la « hiérarchie conceptuelle » de la dimension. Par exemple, la couche supérieure du cube peut organiser les ventes par région, et les couches supplémentaires peuvent être le pays, l’État/la province, la ville et même un magasin spécifique.

En théorie, un cube peut contenir un nombre infini de couches. (Un cube OLAP représentant plus de trois dimensions est parfois appelé un hypercube.) Des cubes plus petits peuvent également exister au sein des couches : par exemple, chaque couche de magasin peut contenir des cubes organisant les ventes par vendeur et par produit. En pratique, les analystes de données créeront des cubes OLAP contenant uniquement les couches dont ils ont besoin, pour une analyse et des performances optimales.

Exploration descendante

L’opération drill-down permet de convertir les données moins détaillées en données plus détaillées par l’une des deux méthodes suivantes : descendre dans la hiérarchie conceptuelle ou ajouter une nouvelle dimension au cube. Par exemple, si vous affichez les données de vente pour le calendrier civil ou le trimestre fiscal d’une organisation, vous pouvez effectuer un drill-down pour voir les ventes de chaque mois, en descendant dans la hiérarchie conceptuelle de la dimension « temps ».

Exploration ascendante

Le roll up est le contraire du drill-down : il agrège les données d’un cube OLAP en remontant dans la hiérarchie conceptuelle ou en réduisant le nombre de dimensions. Par exemple, vous pouvez monter dans la hiérarchie conceptuelle de la dimension « emplacement » en affichant les données de chaque pays plutôt que de chaque ville.

Extraction par tranche et découpage multidimensionnel

L’opération « slice » crée un sous-cube en sélectionnant une seule dimension dans le cube OLAP principal. Par exemple, vous pouvez effectuer un slice en mettant en évidence toutes les données du premier trimestre fiscal ou civil de l’organisation (dimension temporelle).

L’opération « slice » crée un sous-cube en sélectionnant plusieurs dimensions dans le cube OLAP principal. Par exemple, vous pouvez effectuer une opération « dice » en mettant en évidence toutes les données par calendrier ou trimestre fiscal d’une organisation (dimension temporelle) et aux États-Unis et au Canada (dimension géographique).

Rotation

La fonction « pivot » fait pivoter la vue cubique actuelle pour afficher une nouvelle représentation des données, permettant ainsi des vues multidimensionnelles dynamiques des données. La fonction « pivot » de l’OLAP est comparable à la fonctionnalité « tableau croisé dynamique » de tableurs tels que Microsoft Excel, mais si les tableaux croisés dynamiques d’Excel peuvent présenter des difficultés, les pivots OLAP sont relativement simples à utiliser (moins d’expertise est requise) et offrent un temps de réponse et des performances de requête plus rapides.

Schéma montrant la structure d’un cube OLAP

Un cube OLAP avec des dimensions pour les produits, les régions de vente et les trimestres

MOLAP, ROLAP et HOLAP

L’OLAP qui fonctionne directement avec un cube OLAP multidimensionnel est appelé OLAP multidimensionnelou MOLAP. Encore une fois, pour la plupart des utilisations, le MOLAP est le type d’analyse de données multidimensionnelles le plus rapide et le plus pratique.

Cependant, il existe deux autres types d’OLAP qui peuvent être préférables dans certains cas :

ROLAP

Le ROLAP, ou OLAP relationnel, est une analyse de données multidimensionnelles qui opère directement sur les données des tables relationnelles, sans réorganiser au préalable les données dans un cube.

Comme indiqué précédemment, le SQL est un outil parfaitement adapté aux requêtes, aux rapports et aux analyses multidimensionnelles. Mais les requêtes SQL requises sont complexes, les performances peuvent ralentir et la vue des données qui en résulte est statique (il est impossible de la faire pivoter pour représenter une vue différente des données). Le ROLAP est particulièrement utile lorsque la capacité à travailler directement avec de grandes quantités de données est plus importante que les performances et la flexibilité.

HOLAP

Le HOLAP, ou OLAP hybride, tente de créer une division optimale du travail entre les bases de données relationnelles et multidimensionnelles au sein d’une architecture OLAP unique. Les tables relationnelles contiennent de plus grandes quantités de données, et les cubes OLAP sont utilisés pour les agrégations et le traitement spéculatif. Le HOLAP nécessite un serveur OLAP qui prend en charge à la fois le MOLAP et le ROLAP.

Un outil HOLAP peut effectuer un « drill through » jusqu’aux tables relationnelles, ce qui ouvre la voie à un traitement rapide des données et à un accès flexible. Ce système hybride peut offrir une meilleure évolutivité mais ne peut échapper à l’inévitable ralentissement lors de l’accès à des sources de données relationnelles. En outre, son architecture complexe nécessite généralement des mises à jour et une maintenance plus fréquentes, car elle doit stocker et traiter toutes les données provenant de bases de données relationnelles et de bases de données multidimensionnelles. Pour cette raison, le HOLAP peut être plus cher.

AI Academy

La gestion des données est-elle le secret de l’IA générative ?

Découvrez pourquoi des données de haute qualité sont essentielles pour une utilisation réussie de l’IA générative.

Accéder à l’épisode

OLAP et OLTP

Le traitement des transactions en ligne, ou OLTP, fait référence aux méthodes de traitement des données et aux logiciels axés sur les données et les applications orientées transactions.

La principale différence entre l’OLAP et l’OLTP réside dans le nom : l’OLAP est de nature analytique et l’OLTP est transactionnel.

Les outils OLAP sont conçus pour l’analyse multidimensionnelle des données dans un entrepôt de données, qui contient à la fois des données transactionnelles et historiques. En fait, un serveur OLAP est généralement le niveau d’analyse intermédiaire d’une solution d’entreposage de données. Les utilisations courantes de l’OLAP comprennent le data mining et d’autres applications de business intelligence, les calculs analytiques complexes et les scénarios prédictifs, ainsi que les fonctions de production de rapports d’entreprise comme l’analyse financière, la budgétisation et la planification prévisionnelle.

L’OLTP est conçu pour prendre en charge les applications orientées transactions en traitant les transactions récentes aussi rapidement et précisément que possible. Les utilisations courantes de l’OLTP incluent les guichets automatiques, les logiciels de commerce électronique, le traitement des paiements par carte de crédit, les réservations en ligne, les systèmes de réservation et les outils de tenue de dossiers.

Pour en savoir plus sur les différences entre ces approches, consultez l’article « OLAP et OLTP : quelle est la différence ? ».

OLAP et architecture cloud

L’OLAP permet aux entreprises de maximiser le potentiel de leurs données en les convertissant dans le format le plus pratique pour l’analyse multidimensionnelle. Cela permet de dégager plus facilement des informations utiles pour l’entreprise. Cependant, si ces systèmes sont conservés en interne, cela limite le potentiel de montée en charge.

Les services OLAP dans le cloud sont moins coûteux et plus faciles à configurer, ce qui les rend plus attrayants pour les petites entreprises ou les startups à petit budget. Les entreprises peuvent exploiter le vaste potentiel des entrepôts de données dans le cloud, qui effectuent des analyses sophistiquées à des vitesses inégalées grâce au traitement massivement parallèle (MPP). Les entreprises peuvent donc utiliser l’OLAP à la vitesse et à l’échelle du cloud, en analysant de grandes quantités de données sans les déplacer de leur entrepôt de données dans le cloud.

Constance Hotels, Resorts & Golf est un groupe hôtelier de luxe avec neuf propriétés sur les îles de l’Océan indien. Malheureusement, le manque de communication d’île à île a provoqué un cloisonnement organisationnel, avec des données métier isolées dans chaque complexe hôtelier. L’entreprise a mis en place un entrepôt de données cloud et une architecture d’analyse pour relier tous les systèmes et les outils sur site à un référentiel de données central dans le cloud. Ce faisant, l’entreprise a obtenu les informations dont elle avait besoin (à l’échelle du groupe) pour tirer parti d’analyses prédictives avancées et implémenter un système OLAP.

Dans l’architecture cloud, l’OLAP est une solution rapide et rentable conçue pour l’avenir. Une fois les cubes créés, les équipes peuvent utiliser les outils de business intelligence existants pour se connecter instantanément au modèle OLAP et tirer des informations interactives en temps réel de leurs données cloud.

Rendu 3D d'une spirale de plusieurs icônes alignées comme un appareil photo, un bouton de volume et un clipboard

Consultez le guide du responsable des données pour découvrir comment préparer les données de votre organisation à l'IA.

Ressources

Rendu 3D de plusieurs icônes alignées, comme un microphone et une caméra

Les agents d’IA s'appuient sur des données. Les vôtres sont-elles prêtes ?

Vos données sont votre avantage concurrentiel. Découvrez comment les exploiter en toute sécurité et générer un ROI mesurable grâce à l’IA dans ce court webinaire.

La gestion des données expliquée

Techsplainers by IBM présente l’essentiel des données pour l’IA, des concepts clés aux cas d’utilisation concrets. Des épisodes clairs et rapides vous permettent d’apprendre rapidement les principes fondamentaux.

Rendu 3D de plusieurs icônes alignées comme un bouton de volume et un presse-papiers

Unifiez vos données pour dimensionner votre IA

Découvrez pourquoi la mise en place de données adaptées à l’IA commence souvent par un accès efficace aux données structurées et non structurées, ainsi que les défis auxquels peuvent être confrontés les responsables des données.

Des frais juridiques aux informations stratégiques

Découvrez comment un agent juridique alimenté par l’IA aide à accélérer la prise de décision, à réduire le travail manuel et à améliorer la conformité.

Deux hommes qui discutent dans un podcast

AI Academy : Élaborer une stratégie de données pour l’IA d’entreprise

Dans cet épisode, Cathy Reese explique pourquoi les entreprises doivent aujourd’hui se doter d’une stratégie de données adaptée à l’IA avancée, en s’appuyant sur leurs ressources de données les plus qualitatives.

Rendu 3D de plusieurs icônes alignées telles qu’un appareil photo et des avions en papier

Le data lakehouse hybride et ouvert pour l'IA

Simplifiez l’accès aux données et automatisez la gouvernance des données. Découvrez la puissance de l’intégration d’une stratégie de data lakehouse dans votre architecture de données, notamment l’optimisation des coûts de vos workloads et le dimensionnement de l’IA et des analyses, avec toutes vos données, partout.

Rapport sur le coût d’une violation de données 2025

Les coûts liés aux violations de données ont atteint un nouveau sommet. Obtenez des informations actualisées sur les menaces de cybersécurité et leur incidence financière sur les entreprises.

Rendu 3D de deux lignes de plusieurs icônes telles qu’un appareil photo, un bouton de volume et un presse-papiers.

Guide du responsable des données adaptées à l’IA

Comprenez les mesures concrètes que les responsables des données peuvent prendre pour surmonter les défis en matière de données, établir les bases d'un socle de données de confiance et préparer les données de votre entreprise pour l’IA.

Rendu 3D de plusieurs icônes alignées comme un appareil photo, un bouton de volume et un clipboard

Comment la direction transforme les informations en impact

Découvrez les retours de 1 700 CDO dans ce rapport intersectoriel dédié aux responsables de données.

Solutions connexes

IBM StreamSets

Créez et gérez des pipelines intelligents de diffusion de données en continu via une interface graphique intuitive, facilitant ainsi une intégration fluide des données dans les environnements hybrides et multicloud.

Découvrir StreamSets

IBM watsonx.data

watsonx.data vous permet d’adapter le dimensionnement des analyses et de l’IA à toutes vos données, où qu’elles se trouvent, grâce à un entrepôt de données ouvert, hybride et gouverné.

Découvrir watsonx.data

Services de conseil pour les données et les analyses

Avec IBM Consulting, exploitez les données de votre entreprise et développez une organisation basée sur les informations pour tirer des avantages métier.

Découvrir les services d’analytique

Passez à l’étape suivante

Élaborez une stratégie de gestion des données qui élimine les silos, réduit la complexité et améliore la qualité des données pour offrir une expérience client et collaborateur exceptionnelle.

Qu’est-ce que l’OLAP (traitement analytique en ligne) ?