Convertire i flussi di dati nascosti in insight affidabili: OpenLineage all'interno dell'IBM watsonx.data intelligence

IBM watsonx.data intelligence sta ampliando il suo supporto OpenLineage con Custom Lineage Mappings, un miglioramento che porta alla luce le connessioni dati nascoste.

Pubblicato 10 novembre 2025
Molti flussi di dati critici passano attraverso sistemi personalizzati, strumenti ETL e applicazioni legacy che non vengono acquisiti automaticamente dalle soluzioni di lineage standard. Queste connessioni invisibili oscurano le dipendenze, rallentano gli audit e indeboliscono sia la governance che la preparazione all'AI.

La sfida: flussi di dati nascosti che minano la fiducia

Gli scanner automatici coprono molte piattaforme moderne, ma gran parte del percorso dei tuoi dati avviene ancora tramite script personalizzati, pipeline e sistemi legacy. Questi movimenti invisibili frammentano il quadro del lineage, rendendo difficile tracciare le dipendenze o comprendere l'impatto a valle.

Il risultato è un quadro frammentato del percorso dati con punti ciechi che oscurano le dipendenze, rallentano gli audit e indeboliscono la fiducia nelle iniziative di analytics e AI.

La soluzione: visualizzare la storia completa dei tuoi dati con Custom Lineage Mappings

Le mappature personalizzate del lineage in IBM watsonx.data intelligence estendono il lineage oltre gli scanner automatici, illuminando i flussi di dati nascosti attraverso sistemi moderni, personalizzati e legacy.

Basato sullo standard OpenLineage, questo miglioramento permette ai team di collegare ogni set di dati, lavoro e trasformazione in un'unica visione unificata e governata, offrendo così ai team la chiarezza e la fiducia per agire più rapidamente.

Il risultato? Un quadro trasparente e completo delle dipendenze e trasformazioni dei dati, che consente ai leader di rafforzare la governance, accelerare gli audit e promuovere con fiducia l'analytics e la prontezza all'AI.

Come funziona: collegare il lineage automatizzato e personalizzato

La soluzione Custom Lineage Mappings riunisce il meglio: lineage automatizzato dagli scanner, lineage emesso dai produttori esistenti di OpenLineage e lineage personalizzato definito tramite payload OpenLineage.

IBM watsonx.data intelligence utilizza OpenLineage, uno standard aperto per descrivere il modo in cui i dati si muovono durante il runtime o la progettazione. Permette alle organizzazioni di definire gli eventi di lineage per qualsiasi sistema, inclusi quelli personalizzati e quelli legacy, e di riunirli in un grafico di lineage unificato e governato che rivela come i dati si spostano e si trasformano lungo l'intero percorso dati.

Ogni evento OpenLineage descrive come i dati si spostano: gli input che leggono, il processo che li trasforma e gli output che producono. Questi eventi possono essere generati automaticamente da strumenti come dbt o Airflow, oppure i clienti possono decidere se emetterli automaticamente o documentarli manualmente per ambienti proprietari e legacy. Una volta importati, watsonx.data intelligence allinea questi eventi con asset noti e li visualizza all'interno della visione più ampia del lineage.

Per garantire accuratezza e coerenza, watsonx.data intelligence fornisce due meccanismi fondamentali:

  • I modelli di tecnologia definiscono il modo in cui i processi e i set di dati definiti nei payload OpenLineage vengono interpretati e visualizzati. watsonx.data intelligence include modelli predefiniti e consente di crearne di personalizzati, garantendo un lineage coerente tra diverse tecnologie.
  • La mappatura delle fonti di dati collega automaticamente i set di dati e i processi OpenLineage agli asset esistenti in watsonx.data intelligence. È anche possibile definire regole personalizzate per mappare specifici namespace a fonti di dati note, integrando in modo fluido il lineage personalizzato nella vista aziendale gestita.

Di conseguenza, le mappature personalizzate del lineage forniscono un grafo unificato e governato che integra lineage automatizzato e personalizzato.

4 motivi per cui le mappature personalizzate del lineage sono importanti per i responsabili dei dati

Le mappature personalizzate del lineage colmano il divario di visibilità nella comprensione dei dati aziendali, offrendo alle organizzazioni una visione chiara e connessa di ogni flusso di dati, indipendentemente dalla sua origine, in modo che i team possano agire con sicurezza.

I benefici sono accessibili a tutti i team che si affidano a dati accurati e spiegabili:

  • Visibilità end-to-end: scopri come si spostano realmente i dati, in ogni sistema e trasformazione.
  • Un lineage pronto per l'audit: fornisci alle autorità di regolamentazione e agli stakeholder un lineage chiaro e tracciabile.
  • Decisioni più rapide e informate: valuta rapidamente le dipendenze e l'impatto a valle prima di apportare modifiche.
  • Comprensione dei dati condivisi: allineare data engineer, data architect e team di governance attorno a una visione d'insieme della verità.

Basato su standard aperti, potenziato dalla collaborazione

IBM ha scelto OpenLineage, uno standard aperto mantenuto da Linux Foundation AI and Data, per garantire interoperabilità e trasparenza in tutto il tuo ecosistema di dati.

OpenLineage offre la flessibilità, l'estensibilità e la libertà dal blocco da fornitore di cui le aziende hanno bisogno, mentre watsonx.data intelligence aggiunge la governance, la sicurezza e l'integrazione aziendale di IBM.

  • Ampia adozione: fiducia da parte di un ecosistema crescente di strumenti lineage-aware.
  • Apertura ed estensibilità: progettato per evolversi via via che il tuo ecosistema di dati cresce.
  • Libertà da vincoli: open by design, per garantire che il tuo lineage rimanga tuo.
  • Minore barriera all'adozione: un formato familiare e coerente che i team possono iniziare a usare immediatamente.

Basata su OpenLineage, IBM elimina i formati proprietari e garantisce il futuro degli investimenti dei clienti nella documentazione del lineage attraverso standard aperti.

Dal lineage alla leadership: visibilità progettata per l'azione

Con le mappature personalizzate del lineage, IBM watsonx.data intelligence offre alle organizzazioni il potere di vedere e fidarsi dell'intera storia dei loro dati attraverso sistemi automatizzati, personalizzati e di legacy.

Il risultato? Governance più solida, analisi dell'impatto più rapida e decisioni di AI sicure basate su standard aperti e fiducia aziendale.

Man mano che gli ecosistemi dati continuano a evolversi, l'impegno di IBM rimane lo stesso: aiutare le organizzazioni a trasformare la complessità nascosta in decisioni sicure e basate sui dati.

Scopri di più sul data lineage all'interno di watsonx.data intelligence

Esplora la libreria demo di IBM watsonx.data intelligence

Approfondisci le basi tecniche di Custom Lineage Mappings nel blog della nostra community

Jakub Moravec

Product Manager, IBM watsonx.data intelligence

Diana Toma

Product Marketing Manager

