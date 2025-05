Las empresas se enfrentan a una barrera importante para lograr una IA generativa precisa y eficaz—especialmente la IA agéntica. Pero la barrera no es lo que piensan la mayoría de los líderes empresariales.

El problema no son los costos de inferencia o el elusivo modelo "perfecto". El problema son los datos.

Las organizaciones necesitan datos confiables y específicos de la empresa para que la IA agéntica realmente cree valor—los datos no estructurados dentro de correos electrónicos, documentos, presentaciones y videos. Se estima que en 2022, el 90% de los datos generados por las empresas no estaban estructurados, pero IBM proyecta que solo el 1% se contabiliza en los LLM.

Los datos no estructurados pueden ser inmensamente difíciles de aprovechar. Está muy distribuido y es dinámico, está encerrado en diversos formatos, carece de etiquetas claras y, a menudo, necesita contexto adicional para interpretarlo por completo. La generación aumentada por recuperación convencional (RAG) no es eficaz para extraer su valor y no puede combinar adecuadamente datos estructurados y no estructurados.

Mientras tanto, una variedad de herramientas desconectadas puede hacer que la pila de datos para IA sea compleja y engorrosa. Las empresas hacen malabarismos con almacenes de datos, lagos de datos y herramientas de gobernanza de datos e integración. La pila de datos puede resultar tan desorientadora como los datos no estructurados que se supone que debe gestionar.

Muchas organizaciones no están abordando el problema de raíz. Se centran únicamente en la capa de aplicación de IA generativa, en lugar de la capa de datos esencial que se encuentra debajo. Hasta que las organizaciones arreglen su base de datos, los agentes de IA y otras iniciativas de IA generativa no podrán ofrecer todo su potencial.