Qu’est-ce qu’une data fabric ?

Graphique 3D représentant des cubes et des rectangles bleus sur un fond blanc.

Auteurs

Alexandra Jonker

Staff Editor

IBM Think

Tom Krantz

Staff Writer

IBM Think

Qu’est-ce qu’une data fabric ?

Un data fabric est une architecture de données moderne, conçue pour démocratiser l’accès aux données au sein de l’entreprise. Il s’appuie sur des systèmes intelligents et automatisés pour éliminer les silos, gérer les actifs de données et optimiser la gestion de ces dernières à grande échelle.

Au cours de la dernière décennie, les progrès du cloud hybride, de l’intelligence artificielle , de l’Internet des objets (IdO) et de l’edge computing ont alimenté la croissance exponentielle du big data. Cette augmentation a créé des environnements de données de plus en plus complexes, avec d’énormes volumes de données disséminées dans des unités commerciales disparates.

Dans le cadre d’une étude menée en 2025 par l’IBM Institute for Business Value (IBV), 50 % des PDG déclarent que les technologies de leur entreprise sont déconnectées en raison du rythme des investissements récents. L’unification et la gouvernance des données s’avèrent donc essentielles pour surmonter les défis tels que les silos de données, les risques pesant sur la sécurité et les goulots d’étranglement dans la prise de décision.

Pour assurer une gestion intégrée des données de bout en bout, le data fabric associe machine learning (ML), métadonnées actives, interfaces de programmation d’application (API) et d’autres technologies.

Il ne s’agit pas d’un logiciel, mais d’une approche de conception qui crée une vision unifiée des données à travers les environnements sur site et multicloud d’une organisation, incluant data lakes, entrepôts de données, bases de données SQL et d’autres sources. Avec cette approche, les organisations n’ont pas besoin de déplacer toutes leurs données distribuées vers un emplacement ou un magasin de données unique, ni d’adopter une approche totalement décentralisée.

Ces capacités essentielles permettent non seulement d’éliminer les silos de données et de faire face aux volumes de données croissants, mais aussi d’offrir aux utilisateurs professionnels un accès simple, en libre-service, aux données. Il en résulte un réseau de données en temps réel et de données historiques de qualité, qui permet d’accélérer les projets de transformation numérique et de Business Intelligence (BI), quelle que soit l’entreprise, tandis que la gouvernance automatisée garantit une stratégie de données sécurisée et conforme.

À quoi servent les data fabrics ?

Pour de nombreuses entreprises, l’explosion des données (structurées, semi-structurées et non structurées) a rendu inefficaces les approches traditionnelles de gestion. Ce défi est accentué par la prolifération des entrepôts de données, des data lakes et des environnements de cloud hybride.

Ces systèmes de stockage sont généralement choisis comme solutions peu coûteuses pour traiter de grandes quantités de données. Cependant, ils permettent rarement une gestion appropriée des métadonnées, ce qui rend les données difficiles à localiser, à interpréter et à utiliser efficacement.

Les données cloisonnées ajoutent à cette complexité. Historiquement, une entreprise pouvait disposer de plateformes de données distinctes pour les RH, la chaîne d'approvisionnement et les informations clients, chacune fonctionnant de manière isolée malgré des types de données et des besoins qui s'accumulent.

Ces difficultés entraînent une énorme accumulation de dark data ,c’est-à-dire des informations négligées, considérées comme peu fiables et qui ne sont finalement pas utilisées. En fait, environ 60 % des données d’entreprise ne sont jamais analysées.1

Les entreprises utilisent le data fabric pour relever ces défis. L’architecture moderne unifie les données, automatise la gouvernance et permet un accès aux données en libre-service à l’échelle. En reliant des données à travers les systèmes disparates, les data fabrics permettent aux décideurs de faire des liens jusque-là impossibles à déceler et de tirer profit de données qui autrement seraient inutilisées.

Au-delà des avantages liés à la démocratisation et à la prise de décision, les solutions de data fabric s’avèrent essentielles aux workflows d’IA en entreprise. Selon des études menées en 2024 par IBM IBV, 67 % des directeurs financiers déclarent que leur comité de direction dispose des données nécessaires pour tirer parti rapidement des nouvelles technologies. Mais seuls 29 % des responsables technologiques affirment que leurs données possèdent la qualité, l’accessibilité et la sécurité nécessaires pour déployer efficacement l’IA générative à grande échelle.

Avec un data fabric, les entreprises peuvent plus facilement créer une infrastructure de données fiable pour alimenter leurs systèmes d’IA, et les exigences en matière de gouvernance et de confidentialité sont automatiquement appliquées.

Les dernières actualités technologiques, étayées par des avis d’expert

Restez au fait des tendances les plus étonnantes du secteur dans le domaine de l’IA, de l’automatisation, des données et bien d’autres avec la newsletter Think. Consultez la déclaration de confidentialité d’IBM.
Lire la Déclaration de confidentialité d’IBM.

Merci ! Vous êtes abonné(e).

Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.

Fonctionnalités essentielles des data fabrics

L’architecture de type data fabric simplifie l’accès, l’intégration et la protection des données grâce aux fonctionnalités suivantes :
 
  • Catalogue de données
  • Intégration des données
  • Gouvernance et sécurité des données
  • Accès aux données en libre-service
  • Cycle de vie unifié

Catalogues de données

Les architectures de data fabric s’appuient sur des catalogues de données, qui sont des bibliothèques détaillées d’actifs de données. Ces catalogues utilisent des métadonnées actives (reposant sur les graphes de connaissances, la sémantique et l’IA) pour organiser les données en temps réel, afin que les utilisateurs trouvent rapidement et facilement les informations pertinentes pour leurs cas d’utilisation. Ces métadonnées fournissent également une compréhension métier commune des différentes données via des taxonomies, des informations sur la propriété et l’activité, les actifs associés, etc.

Intégration des données

Dans un data fabric, le processus d’intégration des données unifie les données issues de sources disparates, les transforme dans une structure cohérente et les rend accessibles pour l’analyse et la prise de décision. Cette connexion s’effectue selon différents styles d’intégration : traitement par lots, intégration des données en temps réel, ou encore capture des données modifiées (CDC). Des processus d’intégration intelligents permettent de maximiser les performances tout en minimisant les coûts de stockage.

Gouvernance et sécurité des données

Le data fabric unifie l’élaboration et la mise en œuvre des politiques de gouvernance et de sécurité des données à grande échelle. Par exemple, les contrôles d’accès aux données peuvent être automatiquement liés aux données sensibles par le biais des métadonnées (par exemple, les groupes d’utilisateurs ou les classifications de données). Grâce à ces données fiables, protégées et prêtes à l’emploi, les data fabrics permettent aux entreprises d’opérationnaliser l’IA.

Accès aux données en libre-service

Le data fabric fait office de marketplace en libre-service pour la consommation de données. Grâce à des fonctionnalités de gouvernance clés telles que le profilage des données et la gestion des métadonnées, il permet aux ingénieurs en données, aux data scientists et aux utilisateurs professionnels de découvrir rapidement les données de qualité, d’y accéder et de collaborer efficacement. Les utilisateurs peuvent rechercher des actifs de données, les étiqueter, les annoter et ajouter des commentaires. La dépendance à l’égard du service informatique est donc considérablement réduite.

Cycle de vie unifié

Les data fabrics incluent également une gestion de bout en bout tout au long de leur cycle de vie. En alliant opérations de machine learning (MLOps) et IA, cette approche offre une expérience unifiée pour composer, construire, tester, déployer, optimiser et surveiller les différents composants de l’architecture de data fabric, dont les pipelines de données.

Mixture of Experts | 28 août, épisode 70

Décryptage de l’IA : Tour d’horizon hebdomadaire

Rejoignez notre panel d’ingénieurs, de chercheurs, de chefs de produits et autres spécialistes de premier plan pour connaître l’essentiel de l’actualité et des dernières tendances dans le domaine de l’IA.

Data fabric et data mesh

Un data mesh est une architecture de données décentralisée qui organise les données par domaine d’activité (par exemple, marketing, vente ou service client), afin d’offrir plus d’autonomie aux producteurs de jeux de données.

Le data fabric coexiste avec le data mesh et améliore souvent ses fonctionnalités. Il permet d’automatiser les composantes clés de ce dernier, comme la création de produits de données et l’application d’une gouvernance globale.

Data fabric et data lakehouse

Les data lakehouses ont vu le jour en réponse aux défauts des plateformes traditionnelles de gestion des données. Ils associent le stockage de données flexible des data lakes aux capacités d’analyse haute performance des entrepôts de données.

Les data fabrics peuvent être considérés comme la prochaine étape dans l’évolution des data lakehouses et autres plateformes de données. Les entreprises les utilisent pour simplifier la gestion des données et améliorer l’accès aux données des lakehouses. Ils favorisent le partage de données, automatisent l’intégration, ainsi que la gouvernance de ces dernières, et permettent une utilisation en fonction des besoins. Autant de capacités que les référentiels de stockage ne peuvent pas offrir à eux seuls.

Comment fonctionne un data fabric ?

Contrairement aux systèmes de stockage de données individuels, les data fabrics apportent de la fluidité aux environnements de données et résolvent le problème de gravité des données, l’idée selon laquelle les données deviennent plus difficiles à déplacer à mesure que des volumes croissants de nouvelles données arrivent. La data fabric élimine la complexité technologique liée au déplacement, à la transformation et à l’intégration des données, afin de les rendre disponibles à l’échelle de l’entreprise.

Mais comment le data fabric y parvient-il ?

Les data fabrics utilisent divers services de données. Pour comprendre leur fonctionnement, il convient de se pencher sur trois composantes fondamentales : la virtualisation des données, les métadonnées actives fédérées et le machine learning.

Virtualisation des données

La virtualisation rend les données accessibles sans les déplacer physiquement. Au lieu de passer par les processus ETL (extraction, transformation, chargement) traditionnels, l’outil de virtualisation des données se connecte directement à différentes sources et intègre uniquement les métadonnées nécessaires. Il crée ensuite une couche de données virtuelle qui permet aux utilisateurs de rechercher les données et d’y accéder en temps réel, comme si elles se trouvaient dans un référentiel centralisé.

Métadonnées actives fédérées

Les métadonnées actives fédérées facilitent la découverte et l’utilisation des données. Contrairement aux métadonnées passives, qui sont statiques et manuellement organisées, les métadonnées actives fédérées s’appuient sur des graphiques de connaissances sémantiques et des technologies d’IA/ML pour analyser en permanence les métadonnées, détecter les schémas et unifier les données à travers divers systèmes et formats.

Ces systèmes peuvent étiqueter, profiler et classer automatiquement les données. Ils peuvent également déclencher des alertes ou des actions en fonction des modifications apportées aux métadonnées, ce qui rend les écosystèmes de données plus résilients et autonomes.

Machine learning

Le machine learning automatise les processus critiques au sein du data fabric, ce qui en fait une architecture de données avancée et intelligente. Le ML peut être utilisé pour appliquer automatiquement les politiques de gouvernance, générer des informations en temps réel, détecter les vulnérabilités, assurer la traçabilité des données, corriger les problèmes de qualité des données et plus encore.

Architecture data fabric

Si les architectures de type data fabric varient selon les besoins de l’entreprise, elles partagent des fonctionnalités communes. Selon le rapport Enterprise Data Fabric Enables DataOps publié par Forrester, les data fabrics comportent généralement six éléments fondamentaux :2

  1. Gestion des données : cette couche est responsable de la gouvernance, de la sécurité et de la qualité des données.

  2. Ingestion de données : cette couche combine dans le tissu les données provenant de diverses sources (données sur site et cloud).

  3. Traitement de données : cette couche transforme, intègre et nettoie les données pour que les différentes équipes de l’entreprise puissent les utiliser.

  4. Harmonisation des données : cette couche gère le déplacement des données à travers les différents systèmes de données afin qu’elles puissent être utilisées.

  5. Découverte de données : cette couche associe catalogage des données et gestion des métadonnées pour faciliter la recherche et la compréhension des données.

  6. Accès aux données : cette couche facilite la consommation de données au moyen de tableaux de bord et d’autres outils de visualisation, et garantit l’octroi des autorisations adéquates.

Quels sont les avantages du data fabric ?

En plus d’améliorer la gestion des données et l’accès à ces dernières, les data fabrics offrent les avantages suivants :

  • Gains d’efficacité
  • Démocratisation des données
  • Risques réduits
  • Évolutivité et agilité
Gains d’efficacité

Automatiser la gouvernance, l’intégration et d’autres services de données sur plusieurs plateformes permet de rationaliser la gestion des données et leur analyse. En réduisant les goulots d’étranglement, les entreprises sont en mesure d’augmenter leur productivité, ce qui permet d’accélérer la prise de décision et d’alléger la charge de travail des équipes techniques.

En outre, les capacités d’intégration intelligente permettent d’optimiser la performance tout en réduisant le stockage et les coûts.

Démocratisation des données

Les architectures de type data fabric facilitent l’utilisation des applications en libre-service, puisqu’elles rendent les données accessibles au plus grand nombre, et non seulement aux équipes techniques. Elles offrent aux utilisateurs une vue unifiée des données de l’entreprise en créant des connexions quels que soient leur emplacement et leur degré de cloisonnement antérieur.

Risques réduits

Les données accessibles et visibles facilitent considérablement le catalogage des données et l’application de la gouvernance. En outre, un accès élargi aux données se traduit souvent par une multiplication des garde-fous et des approches de sécurité des données, dont le masquage et le chiffrement des données sensibles.

Évolutivité et agilité

Les architectures data fabric sont modulaires et conçues pour évoluer. Elles peuvent évoluer à la fois horizontalement (pour s'adapter à des volumes de données toujours croissants) et verticalement (pour améliorer les processus et les performances).

Solutions connexes
IBM StreamSets

Créez et gérez des pipelines intelligents de diffusion de données en continu via une interface graphique intuitive, facilitant ainsi une intégration fluide des données dans les environnements hybrides et multicloud.

Découvrir StreamSets
Solutions de data fabric

Concevez une architecture de données qui accélère la préparation des données pour l’IA générative et libérez la productivité des équipes chargées des données.

Découvrir les solutions de data fabric
Services de conseil pour les données et les analyses

Avec IBM Consulting, exploitez les données de votre entreprise et développez une organisation basée sur les informations pour tirer des avantages métier.

Découvrir les services d’analytique
Passez à l’étape suivante

Pour prospérer, les entreprises doivent exploiter les données pour fidéliser leur clientèle, automatiser les processus métier et innover avec des solutions pilotées par l’IA.

Explorer les solutions d’analytique Découvrir les services d’analytique