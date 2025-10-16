Aproximadamente el 80 % de los datos empresariales no están estructurados y residen en archivos PDF, correos electrónicos, plataformas de colaboración y repositorios de documentos. Sin embargo, menos del 1 % de estos datos están en un formato adecuado directamente para el consumo de IA. Esta brecha representa tanto una gran oportunidad como un desafío crítico para las organizaciones que están ampliando las iniciativas de IA.​​​​​​

​​​​Los enfoques tradicionales para la preparación de datos no estructurados están frenando a las empresas. Los pipelines manuales tardan entre 6 y 12 meses en construirse y siguen siendo frágiles, y se rompen con cada nuevo formato de documento o cambio en el sistema de origen. Los equipos de ingeniería dedican un tiempo valioso al data plumbing en lugar de a la innovación de IA. Sin la estructura y coherencia adecuadas, los modelos de IA ofrecen resultados poco confiables, lo que socava la confianza y retrasa el tiempo de creación de valor.​​​

​​​​IBM® watsonx.data aborda este desafío como el único lakehouse de datos híbrido y abierto de la industria, creado para IA y analytics. Simplifica el acceso, la preparación y la gobernanza en datos estructurados y no estructurados, ayudando a las organizaciones a establecer una base de datos confiable para la IA generativa a escala.​​​​​