Inteligencia artificial Automatización de TI

Convertir flujos de datos ocultos en conocimientos fiables: OpenLineage dentro de IBM® watsonx.data intelligence

IBM watsonx.data intelligence está ampliando su compatibilidad con OpenLineage con Custom Lineage Mappings, una mejora que saca a la luz esas conexiones de datos ocultas.

Publicado 10 noviembre 2025
Muchos flujos de datos críticos pasan por sistemas personalizados, herramientas de ETL y aplicaciones heredadas que no son capturados automáticamente por las soluciones de linaje estándar. Estas conexiones invisibles ocultan las dependencias, ralentizan las auditorías y debilitan tanto el gobierno como la preparación para la IA.

El reto: flujos de datos ocultos que socavan la confianza

Los escáneres automatizados cubren muchas plataformas modernas, pero gran parte del recorrido de sus datos sigue realizándose en scripts personalizados, pipelines y sistemas heredados. Estos movimientos invisibles fragmentan el panorama del linaje, lo que dificulta el seguimiento de las dependencias o la comprensión del impacto posterior.

El resultado es una imagen fragmentada del recorrido de los datos con puntos ciegos que ocultan las dependencias, ralentizan las auditorías y debilitan la confianza en las iniciativas de análisis e IA.

La solución: ver la historia completa de sus datos con Custom Lineage Mappings

Los mapeos de linaje personalizados en IBM watsonx.data intelligence extienden el linaje más allá de los escáneres automáticos, iluminando flujos de datos ocultos a través de sistemas modernos, personalizados y heredados.

Basada en el estándar OpenLineage, esta mejora permite a los equipos conectar todos los conjuntos de datos, trabajos y transformaciones en una vista unificada y gobernada, lo que les proporciona la claridad y la confianza necesarias para actuar con mayor rapidez.

El resultado es una imagen transparente y completa de las dependencias y transformaciones de los datos, lo que permite a los responsables reforzar el gobierno, acelerar las auditorías y avanzar con confianza en el análisis y la preparación para la IA.

Cómo funciona: conexión entre el linaje automatizado y el personalizado

Custom Lineage Mappings reúne lo mejor de todos los mundos: linaje automatizado de escáneres, linaje emitido por productores OpenLineage existentes y linaje personalizado definido a través de cargas útiles OpenLineage.

IBM watsonx.data intelligence utiliza OpenLineage, un estándar abierto para describir cómo se mueven los datos en tiempo de ejecución o en tiempo de diseño. Permite a las organizaciones definir eventos de linaje para cualquier sistema, incluidos los personalizados y los heredados, y reunirlos en un gráfico de linaje unificado y gobernado que revela cómo se mueven y transforman los datos a lo largo de todo el recorrido de los mismos.

Cada evento de OpenLineage describe cómo se mueven los datos: las entradas que lee, el trabajo que los transforma y los resultados que produce. Estos eventos pueden generarse automáticamente mediante herramientas como dbt o Airflow, o bien los clientes pueden decidir si emitirlos automáticamente o documentarlos manualmente para entornos propietarios y heredados. Una vez importados, watsonx.data intelligence alinea estos eventos con los activos conocidos y los visualiza dentro de una vista de linaje más amplia.

Para garantizar la precisión y la coherencia, watsonx.data intelligence proporciona dos mecanismos básicos:

  • Las plantillas de tecnologías definen cómo se interpretan y muestran los trabajos y los conjuntos de datos definidos en las cargas útiles de OpenLineage. watsonx.data intelligence incluye plantillas predefinidas y le permite crear otras personalizadas, lo que garantiza un linaje coherente en diversas tecnologías.
  • La asignación de fuentes de datos vincula automáticamente los conjuntos de datos y los trabajos de OpenLineage con los activos de datos existentes en watsonx.data intelligence. También puede definir reglas personalizadas para asignar espacios de nombres específicos a fuentes de datos conocidas, integrando el linaje personalizado de manera fluida a la vista empresarial gobernada.

Como resultado, Custom Lineage Mappings proporciona un gráfico gobernado y unificado que integra el linaje automatizado y personalizado.

4 razones por las que Custom Lineage Mappings es importante para los líderes en datos

Custom Lineage Mappings cierra la brecha de visibilidad en la comprensión de los datos empresariales, proporcionando a las organizaciones una visión clara y conectada de cada flujo de datos, independientemente de su origen, para que los equipos puedan actuar con total confianza.

Los beneficios llegan a todos los equipos que dependen de datos precisos y explicables:

  • Visibilidad integral: vea cómo se mueven realmente los datos, en todos los sistemas y transformaciones.
  • Linaje listo para auditorías: proporcione a los reguladores y a las partes interesadas un linaje claro y trazable.
  • Decisiones más rápidas e informadas: evalúe rápidamente las dependencias y el impacto posterior antes de realizar cambios.
  • Comprensión compartida de datos: alinee a los ingenieros de datos, arquitectos y equipos de gobierno en torno a una única visión de la verdad.

Basado en estándares abiertos, impulsado por la colaboración

IBM eligió OpenLineage, un estándar abierto mantenido por Linux Foundation AI and Data, para garantizar la interoperabilidad y la transparencia en todo su ecosistema de datos.

OpenLineage proporciona la flexibilidad, la extensibilidad y la libertad frente al lock-in que necesitan las empresas, mientras que watsonx.data intelligence añade el gobierno, la seguridad y la integración empresarial de IBM.

  • Amplia adopción: con la confianza de un ecosistema cada vez mayor de herramientas conscientes del linaje.
  • Apertura y extensibilidad: diseñado para evolucionar a medida que crece su ecosistema de datos.
  • Libre de ataduras: abierto por diseño, lo que garantiza que su linaje siga siendo suyo.
  • Menor barrera de adopción: formato familiar y coherente que los equipos pueden empezar a utilizar de inmediato.

Basándose en OpenLineage, IBM elimina los formatos propietarios y garantiza el futuro de las inversiones de los clientes en documentación de linaje mediante estándares abiertos.

Del linaje al liderazgo: visibilidad diseñada para la acción

Con Custom Lineage Mappings, IBM watsonx.data intelligence ofrece a las organizaciones la capacidad de ver y confiar en toda su historia de datos en sistemas automatizados, personalizados y heredados.

¿El resultado? Un gobierno más sólido, un análisis de impacto más rápido y decisiones de IA seguras basadas en estándares abiertos y en la confianza de la empresa.

A medida que los ecosistemas de datos siguen evolucionando, el compromiso de IBM sigue siendo el mismo: ayudar a las organizaciones a convertir la complejidad oculta en decisiones seguras y basadas en datos.

Jakub Moravec

Product Manager, IBM watsonx.data intelligence

Diana Toma

Product Marketing Manager

