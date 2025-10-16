Aproximadamente 80% dos dados empresariais são não estruturados e estão localizados em PDFs, e-mails, plataformas de colaboração e repositórios de documentos. No entanto, menos de 1% desses dados estão em um formato adequado diretamente para consumo de IA. Essa lacuna representa uma enorme oportunidade e um desafio crítico para as organizações​​​​ que escalam as iniciativas de IA.​​​​​​

​​​​As abordagens tradicionais para a preparação de dados não estruturados estão atrasando as empresas. Os pipelines manuais exigem de seis a 12 meses para serem construídos e permanecem frágeis, tendo problemas com cada novo formato de documento ou alteração do sistema de origem. As equipes de engenharia gastam um tempo valioso na canalização de dados, em vez de na inovação da IA. Sem a estrutura e a consistência adequadas, os modelos de IA apresentam resultados não confiáveis, prejudicando a confiança e atrasando o time to value.​​​

​​​​O IBM watsonx.data lida com esse desafio como o único data lakehouse híbrido e aberto do setor, criado para IA e análise de dados. Ele simplifica o acesso, a preparação e a governança em dados estruturados e não estruturados, ajudando as organizações a estabelecer uma base de dados confiável para a IA generativa em escala.​​​​​