Accueil
Thèmes
Qu'est-ce qu'un data fabric ?
La structure de données est une architecture qui facilite l'intégration de bout en bout de divers pipelines de données et environnements cloud grâce à l'utilisation de systèmes intelligents et automatisés. Au cours de la dernière décennie, les développements dans le domaine du cloud hybride, de l'intelligence artificielle, de l'Internet des objets (IdO) et de l'informatique de périphérie ont conduit à la croissance exponentielle du Big Data, créant davantage de complexité pour les entreprises. Cela a fait de l'unification et de la gouvernance des environnements de données une priorité croissante, car cette croissance a créé des défis importants, tels que des silos de données, des risques de sécurité et des goulots d'étranglement généraux pour la prise de décision. Les équipes de gestion des données relèvent ces défis de front avec des solutions de Data Fabric. Ils les exploitent pour unifier leurs systèmes de données disparates, intégrer la gouvernance, renforcer les mesures de sécurité et de confidentialité et offrir une plus grande accessibilité aux données aux travailleurs, en particulier à leurs utilisateurs professionnels.
Ces efforts d'intégration de données via les data fabrics permettent une prise de décision plus holistique et centrée sur les données. Historiquement, une entreprise peut avoir eu différentes plates-formes de données alignées sur des secteurs d'activité spécifiques. Par exemple, vous pouvez avoir une plate-forme de données RH, une plate-forme de données de chaîne d'approvisionnement et une plate-forme de données client, qui hébergent des données dans des environnements différents et séparés malgré les chevauchements potentiels. Cependant, une structure de données peut permettre aux décideurs de visualiser ces données de manière plus cohérente afin de mieux comprendre le cycle de vie du client, en établissant des liens entre des données qui n'existaient pas auparavant. En comblant ces lacunes dans la compréhension des clients, des produits et des processus, les structures de données accélèrent les initiatives de transformation numérique et d'automatisation dans toutes les entreprises.
Virtualisation des données est l'une des technologies qui permet une approche data fabric. Plutôt que de déplacer physiquement les données de diverses sources sur site et dans le cloud à l'aide de la norme ETL (extraction, transformation, chargement), un outil de virtualisation des données se connecte aux différentes sources, n'intègre que les métadonnées nécessaires et crée une couche de données virtuelles. Cela permet aux utilisateurs d'exploiter les données sources en temps réel.
Découvrez pourquoi le rapport Magic Quadrant 2024 de Gartner cite IBM comme un leader en matière de solutions de qualité des données renforcée
Les services de données et les API rassemblent les données des systèmes existants, des datalakes, des entrepôts de données, des bases de données SQL, et des applications, pour offrir une vue globale sur les performances de l'entreprise. Contrairement à ces systèmes de stockage de données individuels, il vise à créer plus de fluidité dans les environnements de données, en essayant de contrer le problème de la gravité des données, c'est-à-dire l'idée que les données deviennent plus difficiles à déplacer à mesure qu'elles grandissent. Une structure de données élimine les complexités technologiques engagées pour le déplacement, la transformation et l'intégration des données, rendant toutes les données disponibles dans toute l'entreprise.
Les architectures de Data Fabric fonctionnent autour de l'idée de coupler de manière lâche les données des plates-formes avec les applications qui en ont besoin. Un exemple d'architecture de Data Fabric dans un environnement multi-cloud peut ressembler à ce qui suit, où un cloud, comme AWS, gère l'ingestion de données et une autre plate-forme, telle qu'Azure, supervise la transformation et la consommation des données. Ensuite, vous pouvez avoir un troisième fournisseur, comme IBM® Cloud Pak for Data, fournissant des services analytiques. L'architecture Data Fabric assemble ces environnements pour créer une vue unifiée des données.
Cela dit, ce n'est qu'un exemple. Il n'existe pas d'architecture de données unique pour une structure de données, car différentes entreprises ont des besoins différents. Le nombre variable de fournisseurs de cloud et d'implémentations d'infrastructures de données garantit des variations entre les entreprises. Cependant, les entreprises utilisant ce type de cadre de données présentent des points communs dans leurs architectures, qui sont propres à une structure de données. Plus précisément, ils ont six composantes fondamentales, que Forrest (le lien réside en dehors d'ibm.com) décrit dans le rapport "Enterprise Data Fabric Enables DataOps". Ces six couches comprennent les éléments suivants :
Alors que les fournisseurs de Data Fabric sont de plus en plus adoptés par les entreprises du marché, Gartner (le lien réside en dehors d'ibm.com) a noté des améliorations spécifiques en termes d'efficacité, affirmant qu'il peut réduire "le temps de conception d'intégration de 30 %, de déploiement de 30 % et de maintenance de 70 %". S'il est clair que les data fabrics peuvent améliorer la productivité globale, les avantages suivants ont également démontré une valeur commerciale pour les utilisateurs :
Les tissus de données en sont encore à leurs balbutiements en termes d'adoption, mais leurs capacités d'intégration de données aident les entreprises dans la découverte de données, leur permettant de prendre en charge une variété de cas d'utilisation. Bien que les cas d'utilisation qu'une structure de données puisse gérer ne soient pas extrêmement différents des autres produits de données, elle se différencie par la portée et l'échelle qu'elle peut gérer en éliminant les silos de données. En intégrant diverses sources de données, les entreprises et leurs scientifiques des données peuvent créer une vue globale de leurs clients, ce qui s'est avéré particulièrement utile pour les clients bancaires. Les data fabrics ont été plus spécifiquement utilisés pour :
IBM Cloud Pak for Data est une plateforme de données ouverte et extensible qui fournit une structure de données pour rendre toutes les données disponibles pour l'IA et l'analyse, sur n'importe quel cloud.
Créez, exécutez et gérez des modèles d'IA. Préparez des données et créez des modèles sur n'importe quel cloud à l'aide de code open source ou de modélisation visuelle. Anticipez et optimisez vos résultats.
Découvrez Db2 on Cloud, une base de données cloud SQL entièrement gérée, configurée et optimisée pour des performances robustes.
Lisez le rapport sur la façon dont votre organisation peut aller au-delà de la base de données et créer une structure de données où les bonnes données sont disponibles au bon endroit et dans la bonne application au bon moment.
Lisez le smartpaper sur la façon de créer une base de données solide pour l'IA en vous concentrant sur trois domaines clés de la gestion des données : l'accès, la gouvernance, la confidentialité et la conformité.
Écoutez ce webinaire pendant que IBM et Gartner discutent de l'avenir et de l'importance de la structure de données et de ses composants principaux.
Découvrez comment la State Bank of India a utilisé plusieurs solutions IBM, ainsi que la méthodologie IBM® Garage, pour développer une plateforme bancaire en ligne complète.
La structure de données peut aider les entreprises qui investissent dans l'IA, l'apprentissage automatique, l'Internet des objets et l'informatique de périphérie à tirer davantage de valeur de leurs données.