El 11 de junio de 2025, IBM lanzó su nuevo enfoque para la integración de datos: watsonx.data integration. Esta solución ofrece un único plano de control para crear pipelines por lotes, streaming en tiempo real y replicación de datos, respaldado por la observabilidad integrada.

Dentro de la misma solución, los equipos pueden crear pipelines de datos no estructurados reutilizables junto con las estructuradas, desbloqueando una mina de oro de datos previamente inaccesibles para impulsar nuevos casos de uso y satisfacer las demandas cambiantes de los entornos de datos modernos. Con la capacidad de Integración de datos no estructurados (UDI) de watsonx.data integration, los usuarios pueden crear de forma intuitiva pipelines que consumir, transformen y procesen grandes volúmenes de datos no estructurados, incluidos documentos, PDF, PPT y más, en cuestión de minutos.

Este producto combina innovaciones revolucionarias de código abierto y patentadas directamente de IBM® Research. Algunas de las mejores características del producto incluyen:

Ingesta fluida de diversos tipos de datos no estructurados procedentes de una amplia gama de fuentes empresariales mediante conectores prediseñados

Transformación de arrastrar y soltar con operadores prediseñados respaldados por IBM Research para limpiar, normalizar y preparar contenido no estructurado para la IA

Población automatizada del almacén de vectores, que permite almacenar los embeddings en bases de datos vectoriales compatibles para la generación aumentada por recuperación (RAG) y otros casos de uso de IA

Diseñada para gestionar los datos empresariales que tradicionalmente se han infrautilizado, watsonx.data integration marca un gran paso adelante en el desbloqueo de datos no estructurados para la IA y la analítica.