Agentes que escalam versus agentes que param

Ilustração isométrica de quadrados e círculos 3D geométricos

Toda organização precisa de solucionadores de problemas. Refiro-me a operadores independentes que desdenham o tipo de ajuda que assola empresas ineficientes e confiantes o suficiente para lerem nas entrelinhas. Quando o software demonstra esse tipo de inteligência, dizemos "apenas funciona". Quando é um funcionário, dizemos "apenas entende". 

Por outro lado há o espectro oposto, caracterizado por adiamentos, atrasos e indecisão. Frequentemente atrasados ou agindo com base em informações desatualizadas, esses funcionários insistentes paralisam tudo e rotineiramente provocam uma das frases mais frustrantes no jargão corporativo: "Eu mesmo farei isso". 

Milhões de agentes de IA (e você sem dúvida já sabe disso ao ler este blog) serão criados e implementados nos próximos anos. De acordo com o IBM Institute for Business Value, cerca de 70% dos executivos entrevistados afirmam que a IA agêntica é crucial para sua estratégia futura.  A questão é: que tipo de agentes você está liberando — solucionadores de problemas ou criadores de problemas?   

A diferença entre os dois resume-se a um adversário conhecido: os silos. É muito tentador confirmar o viés de otimismo durante as condições ideais da temporada piloto; quando chega a hora do melhor, ou seja, da implementação em toda a empresa, as complexidades dos grandes negócios impedem o progresso.  Workflows complicados, governança fragmentada e acesso a dados incoerentes transformam cada agente em um problema de manutenção. O que deveria impulsionar a produtividade torna-se um grande dreno de produtividade. Chame isso de ironia da IA.

Para escalar, as organizações devem comandar todos os seus agentes de forma holística, criando uma lista de colaboradores de IA consistentemente organizados que se integrem facilmente às ferramentas existentes. Quando a orquestração funciona, os processos se alinham, os silos se dissolvem e o potencial da IA se transforma em resultados reais. Ainda assim, a orquestração por si só não vencerá a corrida da IA. Os dados são o diferenciador. É a força que torna seus agentes (todos eles, não apenas os casos de teste POC) fluentes em seus negócios e confiáveis o suficiente para agirem com autonomia.

Afinal, dados genéricos levam a uma IA genérica que fala no mesmo tom monótono de seus concorrentes. Ou pior, dados mal gerenciados podem transformar a IA em um passivo que espalha erros mais rápido e mais longe do que qualquer humano jamais poderia.  

Demorou muito tempo para o mercado reconhecer a importância de se prepararem os dados para a IA, um descuido que fez com que o ROI ficasse sem definição e se manifestasse em uma série de estatísticas demonstrando que a maioria das organizações ainda está presa na fase piloto. De fato, apenas 5% das organizações entrevistadas integraram ferramentas de IA em fluxos de trabalho em escala, de acordo com um relatório do MIT. 

A grande reinicialização de dados

Uma grande correção está em curso, com organizações investindo bilhões em suas iniciativas de dados. De acordo com dados de uma pesquisa futura do IBM Institute of Business Value, aproximadamente 13% dos orçamentos de TI foram alocados para estratégia de dados em 2025, um aumento em relação aos 4% registrados em 2022. Da mesma forma, 82% dos diretores de dados entrevistados relataram que estão contratando para funções que não existiam no ano passado.  

O objetivo, claro, é equipar sua IA com o tipo de dados proprietários e confiáveis que tornam sua empresa única. Quando você ou seus clientes solicitam respostas à IA, ela deve retornar informações contextualmente relevantes e consistentes com as metas, os valores e as obrigações regulatórias da sua organização. A IA agêntica aumenta ainda mais as apostas. Quando você coloca um agente em ação e o capacita a tomar decisões e buscar metas explícitas, deve confiar que ele conhece totalmente seus negócios e sua cultura (seus dados). 

Para que os agentes sejam bem-sucedidos, precisam de dados de qualidade que, segundo a Data Management Association, são dados precisos, completos, consistentes, oportunos, únicos e válidos. A IBM adiciona uma sétima dimensão de qualidade de dados, a homogeneidade, que é uma medida de qualidade que garante que dados variados possam ser harmonizados para interpretação consistente e enriquecidos para a compreensão semântica.

Manter a qualidade dos dados não é fácil, principalmente na era dos zettabytes. Os processos manuais de controle de qualidade são demorados, propensos a erros e exigem um número de profissionais de dados que simplesmente não existe em meio à persistente escassez de talentos. 

As organizações tentaram diminuir essa lacuna construindo precárias pilhas de dados que desmoronam com data warehouses, data lakes e ferramentas de integração. Correções, painéis de controle e scripts aumentam ainda mais o tamanho do sistema. A abordagem ad hoc frequentemente leva a dívidas técnicas que se acumulam constantemente e de forma imprevisível. A inovação fica em segundo plano quando sua equipe de TI fica presa somente à manutenção, perdendo a produtividade nas fendas do seu conjunto de dados. 

Para onde vamos a partir daqui? 

Como construir uma base sólida de dados

A resposta começa com uma camada de dados que conecta, enriquece e controla todas as fontes de dados e serve como fonte para agentes de IA fluentes no contexto e na voz da sua organização. Com essa base, os agentes entregam decisões nas quais você pode confiar, acelerando workflows, reduzindo riscos e impulsionando a produtividade em escala.

Os metadados são a linguagem dessa camada. Disponibilizam o contexto que torna seus dados facilmente consumíveis para IA ou cargas de trabalho mais tradicionais, como análises e engenharia de dados. No entanto, a classificação manual não é escalável. A marcação automática faz isso porque aplica a estrutura na velocidade da ingestão. Ela captura a linhagem, a sensibilidade e o significado do negócio, com supervisão humana disponível quando necessária para reduzir os riscos e acelerar as tarefas posteriores, como recuperação e conformidade. Resumindo, transforma ativos brutos em conhecimento contextual e governado antes mesmo que alguém peça por ele. 

O contexto é poderoso. Em última análise, isso leva a uma IA mais precisa e a uma tomada de decisão mais confiante. Entretanto, dados sem as permissões certas são um passivo, não um ativo.

As regras de acesso não devem ficar armazenadas em planilhas. Devem viajar com os dados. À medida que os ativos são migrados de um armazenamento para um lakehouse e, em seguida, para um trabalho de ajuste fino, as permissões também devem ser migradas. Quando as políticas são aplicadas com base na identidade, na função e no propósito, as pessoas certas veem os dados certos no momento certo. Esse processo reduz o risco, evita a exposição acidental e impede que o cumprimento das normas se transforme em um exercício de segurança.

Uma governança forte é essencial, mas é apenas parte da equação. A arquitetura abaixo dele determina se o controle aumenta ou para. Aberto e híbrido por design é a abordagem correta, pois a maioria das empresas já abrange múltiplas nuvens e locais. Separar armazenamento e computação evita migrações custosas e as interrupções que elas causam. Formatos de arquivo abertos, como o Apache Iceberg, tornam isso possível desacoplando as aplicações do armazenamento, permitindo que ferramentas leiam e escrevam dados no local onde quer que se encontrem. Impedem a dependência do banco de dados de um único fornecedor. Flexibilidade não é luxo, é salvaguarda contra custos descontrolados e sistemas rígidos que não conseguem se adaptar quando as prioridades mudam. Não é de se estranhar, então, que três quartos das organizações esperem aumentar o uso de tecnologias de IA de código aberto, inclusive formatos de arquivo abertos, nos próximos anos, citando custos de implementação e manutenção mais baixos, segundo um estudo da McKinsey

O conteúdo não estruturado já não está fora de alcance

Os dados não estruturados continuam sendo o grande reservatório inexplorado. Espero que faturas, e-mails, logs, imagens e até mesmo este blog contenham insights que raramente são usadas em análise de dados porque estão espalhadas por sistemas, bloqueadas em formatos incompatíveis e sem rótulos organizados. A extração manual não é fácil. Exige horas de esforço humano, gera erros e colapsos sob o peso de dados em escala corporativa. A automação é a única maneira de impor ordem em nível corporativo: identificando entidades, capturando valores e estratificando semânticas que reflitam como sua empresa realmente se expressa e como ela quer aparecer no mercado. A partir daí, surge um esquema no qual as máquinas podem processar e os humanos, assim como os agentes de IA, podem confiar. 

Quando esses dados enriquecidos fluem para uma camada de recuperação que combina texto com SQL, recuperação vetorial e consultas híbridas, os agentes param de adivinhar. Começam a raciocinar e agir com confiança. Os sistemas RAG tradicionais, por outro lado, geralmente têm dificuldade para entender o contexto, o que os torna inadequados para o raciocínio em escala empresarial. Uma abordagem unificada evita essas armadilhas, dando aos agentes a profundidade e a precisão de que precisam para agir de forma decisiva.

Transformar o caos não estruturado em clareza estruturada é um começo, mas a inteligência é o que torna essa clareza útil. Sem ele, mesmo os dados mais bem organizados permanecem inertes. A inteligência de dados dá a cada ativo uma história de onde veio, como mudou e quem é responsável por isso. Catalogação e linhagem não são apenas tarefas da manutenção; são a base da confiança. A pontuação de qualidade garante que os agentes não estejam raciocinando em terreno instável. A publicação de produtos de dados com termos bem definidos transforma recursos brutos em serviços consumíveis nos quais as equipes podem confiar. Quando um agente cita uma figura, a fonte deve estar a um clique de distância. Quando uma definição muda, todos os sistemas dependentes devem saber antes que a próxima decisão seja tomada.

Mas somente inteligência não é suficiente. Um relatório da IBM de 2024 sobre IA em ação constatou que a complexidade dos dados, incluindo a integração entre sistemas fragmentados, permanece uma das principais barreiras para a escalabilidade da IA. Os agentes e outros sistemas que dependem de dados precisam de integração constante, e não uma única vez. Integração é como os dados são moldados em movimento: padronizados, enriquecidos, governados e prontos para uso enquanto fluem. Os pipelines devem se adaptar a cada execução, aprendendo com a mudança e otimizando desempenho, custo e qualidade. Observabilidade também importa. Quando a integração é visível e responsiva, sistemas posteriores, inclusive os agentes, não herdam erros silenciosos nem lógica obsoleta.

Quando a integração e a inteligência trabalham juntas, o resultado parece familiar: simplesmente funciona. Não por sorte, mas porque a arquitetura subjacente é deliberada. Uma camada de dados que conecte seu patrimônio, aplique significado e conduza a governança a cada movimento, seja agente ou não, aumenta a precisão e impulsiona a tomada de decisões com confiança. É assim que você transforma uma demonstração promissora em um sistema confiável. É assim que se migra dos pilotos para a produção sem perder o foco.

Lou Foglia

Associate Creative Director

IBM

Fontes

1. From AI projects to profits: How agentic AI can sustain financial returns, IBM Institute for Business Value, 9 de junho de 2025.

2. The GenAI Divide: State of AI in Business 2025, MIT Nanda, julho de 2025

3. The AI multiplier effect: Accelerate growth with decision-ready data, IBM Institute for Business Value, dezembro de 2025

4. The Six Primary Dimensions for Data Quality Assessment, DAMA United Kingdom, outubro de 2013.

5. Data quality dimensions, IBM, 17 de outubro de 2025.

6. Open source technology in the age of AI, McKinsey & Company, the Mozilla Foundation and the Patrick J. McGovern Foundation, abril de 2025.

7. AI in Action 2024, IBM, 2024.

Dê o próximo passo

IBM® watsonx Orchestrate e IBM watsonx.data ajudam as organizações a criar agentes de IA moldados por seus dados confiáveis.

Conheça o watsonx Orchestrate Conheça o watsonx.data