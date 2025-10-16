Aproximadamente el 80 % de los datos empresariales no están estructurados y residen en archivos PDF, correos electrónicos, plataformas de colaboración y repositorios de documentos. Sin embargo, menos del 1 % de estos datos están en un formato adecuado para su consumo directo por parte de la IA. Esta brecha representa tanto una gran oportunidad como un desafío crítico para las organizaciones​​​​ que están ampliando las iniciativas de IA.​​​​​​

​​​​Los enfoques tradicionales para la preparación de datos no estructurados están frenando a las empresas. Los pipelines manuales tardan entre 6 y 12 meses en construirse y siguen siendo frágiles, ya que se rompen con cada nuevo formato de documento o cambio en el sistema de origen. Los equipos de ingeniería dedican un tiempo valioso a la fontanería de datos en lugar de a la innovación de la IA. Sin una estructura y coherencia adecuadas, los modelos de IA ofrecen resultados poco fiables, lo que socava la confianza y retrasa el tiempo de obtención de valor.​​​

​​​​IBM® watsonx.data aborda este desafío como el único lakehouse de datos híbrido y abierto de los sectores creado para la IA y el análisis. Simplifica el acceso, la preparación y el gobierno de datos estructurados y no estructurados, ayudando a las organizaciones a establecer una base de datos de confianza para la IA generativa a escala.​​​​​