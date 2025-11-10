Intelligence artificielle Automatisation informatique

Transformer des flux de données cachés en informations fiables : OpenLineage au sein d’IBM watsonx.data intelligence

IBM watsonx.data intelligence étend son support OpenLineage avec des mappages personnalisés de la traçabilité, une amélioration qui met en lumière ces connexions de données cachées.

Publié 10 novembre 2025
De nombreux flux de données critiques transitent par des systèmes personnalisés, des outils ETL et des applications héritées qui ne sont pas automatiquement capturés par les solutions de traçabilité standard. Ces connexions invisibles masquent les dépendances, ralentissent les audits et affaiblissent à la fois la gouvernance et la préparation à l’IA.

Le défi : des flux de données cachés qui nuisent à la confiance

Les scanners automatisés couvrent de nombreuses plateformes modernes, mais une grande partie du parcours de vos données se déroule encore dans des scripts personnalisés, des pipelines et des systèmes hérités. Ces mouvements invisibles fragmentent la traçabilité, ce qui complique la recherche des dépendances et la compréhension de l’impact en aval.

Le résultat est une image fragmentée du parcours des données avec des angles morts qui masquent les dépendances, ralentissent les audits et affaiblissent la confiance dans les initiatives d’analytique et d’IA.

La solution : consulter l’historique complet de vos données grâce à des mappages personnalisés de la traçabilité

Les mappages personnalisés de la traçabilité dans IBM watsonx.data intelligence étendent leur lignée au-delà des scanners automatisés, éclairant les flux de données cachés à travers des systèmes modernes, personnalisés et hérités.

Basée sur la norme OpenLineage, cette amélioration permet aux équipes de relier chaque jeu de données, job et transformation en une vue unifiée et gouvernée, offrant ainsi aux équipes la clarté et la confiance nécessaires pour agir plus rapidement.

Résultat : une vision transparente de bout en bout des dépendances aux données et des transformations permet aux dirigeants de renforcer la gouvernance, d’accélérer les audits et de faire progresser les analyses et la préparation à l’IA en toute confiance.

Fonctionnement : connexion des traçages automatisés et personnalisés

Les mappages personnalisés de la traçabilité réunissent les meilleurs atouts : traçage automatisé à partir de scanners, traçage émis par les producteurs OpenLineage existants et traçage personnalisé défini par le biais des charges utiles OpenLineage.

IBM watsonx.data intelligence utilise OpenLineage, un standard ouvert pour décrire comment les données se déplacent au moment de l’exécution ou de la conception. Il permet aux entreprises de définir des événements de lignée pour n’importe quel système, y compris personnalisés et hérités, et de les rassembler dans un graphique de traçabilité unifié et gouverné qui révèle comment les données se déplacent et se transforment tout au long du parcours des données.

Chaque événement OpenLineage décrit comment les données se déplacent : les entrées qu’il lit, la tâche qui les transforme et les sorties qu’il produit. Ces événements peuvent être générés automatiquement par des outils tels que dbt ou Airflow, ou les clients peuvent décider de les émettre automatiquement ou de les documenter manuellement pour les environnements propriétaires et d’héritage. Une fois importés, watsonx.data intelligence aligne ces événements sur les actifs connus et les visualise dans une perspective de lignée plus large.

Pour garantir précision et cohérence, watsonx.data intelligence fournit deux mécanismes principaux :

  • Les modèles technologiques définissent la manière dont les tâches et les jeux de données définis dans les charges utiles OpenLineage sont interprétés et affichés. watsonx.data intelligence comprend des modèles prédéfinis et vous permet de créer des modèles personnalisés, garantissant ainsi une cohérence entre les différentes technologies.
  • Le mappage des sources de données relie automatiquement les jeux de données et les jobs d’OpenLineage aux actifs existants dans watsonx.data intelligence. Vous pouvez également définir des règles personnalisées pour mapper des espaces de noms spécifiques à des sources de données connues, en intégrant la traçabilité personnalisée de façon fluide dans la vue d’entreprise gouvernée.

Par conséquent, les mappages personnalisés de la traçabilité fournissent un graphique régi et unifié qui intègre une traçabilité automatisée et personnalisée.

4 raisons pour lesquelles les mappages personnalisés de la traçabilité sont importants pour les responsables des données

Les mappages personnalisés de la traçabilité comblent le manque de visibilité dans la compréhension des données d’entreprise, offrant aux entreprises une vue claire et connectée de chaque flux de données, quel que soit leur emplacement d’origine, permettant aux équipes d’agir en toute confiance.

Les avantages atteignent chaque équipe qui s’appuie sur des données précises et explicables :

  • Visibilité de bout en bout : visualisez le véritable mouvement des données, à travers chaque système et chaque transformation.
  • Traçabilité prête pour l’audit : fournissez aux régulateurs et aux parties prenantes une traçabilité claire et traçable.
  • Des décisions plus rapides et mieux informées : évaluez rapidement les dépendances et l’impact en aval avant d’apporter des modifications.
  • Compréhension partagée des données : alignez les ingénieurs de données, les architectes et les équipes de gouvernance autour d’une vue unique de la vérité.

Fondé sur des standards ouverts, alimenté par la collaboration

IBM a choisi OpenLineage, une norme ouverte gérée par la Linux Foundation IA et Data, pour garantir l’interopérabilité et la transparence dans votre écosystème de données.

OpenLineage offre la flexibilité, l’extensibilité et l’absence de verrouillage dont les entreprises ont besoin, tandis que watsonx.data intelligence ajoute la gouvernance, la sécurité et l’intégration d’entreprise d’IBM.

  • Adoption généralisée : fiable grâce à un écosystème croissant d’outils prenant en compte la traçabilité des données.
  • Ouverture et extensibilité : conçu pour évoluer au rythme de la croissance de votre écosystème de données.
  • Absence de verrouillage : ouverte dès le départ, pour que votre traçabilité reste la vôtre.
  • Réduction des obstacles à l’adoption : format familier et cohérent que les équipes peuvent commencer à utiliser immédiatement.

Basé sur OpenLineage, IBM supprime les formats propriétaires et pérennise les investissements des clients dans la documentation de la lignée grâce à des normes ouvertes.

De la lignée au leadership : une visibilité conçue pour l’action

Grâce aux mappages personnalisés de la traçabilité, IBM watsonx.data intelligence permet aux entreprises de consulter l’intégralité de leurs données et de s’y fier sur leurs systèmes automatisés, personnalisés et existants.

Résultat ? Une gouvernance plus forte, une analyse d’impact plus rapide et des décisions d’IA sûres, fondées sur des normes ouvertes et la confiance des entreprises.

Alors que les écosystèmes de données continuent d’évoluer, l’engagement d’IBM reste le même : aider les entreprises à transformer la complexité cachée en décisions fondées sur les données et sûres.

Jakub Moravec

Product Manager, IBM watsonx.data intelligence

Diana Toma

Product Marketing Manager

