De microsserviços a agentes de IA: a evolução da arquitetura de aplicações

Alguns colegas compartilhando ideias em um escritório moderno

A arquitetura de aplicações chegou novamente a um ponto de inflexão. Os agentes de IA estão emergindo como blocos de construção poderosos para sistemas modernos, complementando, estendendo ou até mesmo substituindo os microsserviços tradicionais.

Essa mudança arquitetônica mantém o padrão fundamental de componentes combináveis, ao mesmo tempo em que proporciona ganhos significativos em velocidade de desenvolvimento, adaptabilidade e recursos de integração. As organizações que constroem novas aplicações com frameworks agênticos se posicionam para obter vantagem competitiva no cenário tecnológico em rápida evolução.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

A jornada de evolução arquitetônica

A história da arquitetura de aplicações revela um padrão consistente de decomposição em componentes cada vez mais inteligentes.

Década de 1990: aplicações monolíticas
Sistemas de código-base único dominaram a computação empresarial, criando desafios operacionais significativos:

  • As implementações exigiam ciclos de teste extensivos
  • O escalonamento exigia a duplicação total do sistema
  • Mudanças em uma área correm o risco de desativar funções não relacionadas
  • Ciclos de desenvolvimento que se estendem por meses ou anos

Início da década de 2000: arquitetura orientada a serviços (SOA)
A SOA lidava com as limitações monolíticas decompondo aplicações em serviços alinhados aos negócios:

  • A nova arquitetura melhorou os recursos de reutilização e integração
  • Os serviços continuaram relativamente pesados
  • A complexidade da orquestração criou sistemas frágeis
  • Os ciclos de desenvolvimento eram medidos em meses

Década de 2010: microsserviços
A arquitetura de microsserviços dividiu as aplicações em unidades menores e implementáveis de forma independente:

  • Cada microsserviço operado de forma autônoma
  • Os serviços eram comunicados por meio de interfaces de programação de aplicativos (APIs) bem definidas
  • Componentes escalados independentemente
  • Tecnologias de conteinerização simplificaram a implementação
  • Os ciclos de desenvolvimento foram reduzidos a semanas
Mixture of Experts | 28 de agosto, episódio 70

Decodificando a IA: resumo semanal das notícias

Participe do nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Agentes de IA: o novo paradigma arquitetônico

A fronteira arquitetônica atual apresenta agentes de IA: componentes inteligentes e autônomos que aprimoram os recursos tradicionais dos microsserviços. As principais diferenças incluem:

Característica
 

Microsserviço
 

Agente de IA
 

Modelo de programação

Impulsiona regras e lógica explícitas

Oferece um modelo híbrido: núcleo compilado com camada de raciocínio

Capacidade de adaptação

Exige alterações de código

Combina otimização com raciocínio dinâmico

Integração

Usa contratos de APIs

Usa modo duplo: contratos de APIs com compreensão semântica

Tratamento de erros

Tem respostas pré-programadas

Tem caminhos otimizados com fallbacks adaptativos

Esforço de desenvolvimento

Requer um alto nível de esforço (código de finalidade única)

É mais estratégico (caminhos críticos mais interfaces de raciocínio)

 

Um microsserviço tradicional de processamento de pagamentos requer milhares de linhas de código para lidar com validação, processamento, estados de erro e integrações. Por outro lado, os agentes de IA de alto desempenho combinam componentes pré-compilados para caminhos críticos com recursos de raciocínio para decisões complexas. Essa abordagem híbrida ajuda a garantir tanto a confiabilidade do desempenho quanto a inteligência adaptativa.

Por exemplo, a implementação de agentes do Kernel Semântico em C# com compilação antecipada (AOT) demonstra que os sistemas agênticos de produção podem igualar ou exceder os microsserviços tradicionais em desempenho, adicionando valiosos recursos de raciocínio.

Frameworks agênticos: orquestração moderna

Assim como os microsserviços exigem plataformas de orquestração subjacentes, os agentes de IA precisam de frameworks agênticos especializados. Soluções modernas, como Semantic Kernel e LangChain Enterprise, fornecem essa infraestrutura necessária para coordenação de agentes com desempenho de nível empresarial.

Esses frameworks oferecem capabilities que vão além da orquestração de serviços tradicional, mantendo os padrões de desempenho de nível empresarial esperados:

  • Base de alto desempenho: os frameworks agênticos são construídos em linguagens compiladas com compilação AOT para execução previsível e de baixa latência.
  • Projeto com eficiência de memória: os frameworks agênticos são otimizados para sistemas de alta taxa de transferência para ajudar a garantir o consumo mínimo de recursos.
  • Processamento semântico: os agentes alocam recursos computacionais com base na complexidade da tarefa.
  • Integração empresarial: os frameworks agênticos fornecem conectores de tipo seguro para sistemas existentes com forte imposição de contratos.
  • Planejamento híbrido: os caminhos críticos de desempenho do framework agêntico usa lógica compilada, enquanto cenários complexos usam IA para raciocínio.

Benefícios de negócios práticos

A mudança para a arquitetura agêntica oferece vantagens mensuráveis, como:

  • Desempenho com inteligência: agentes de IA bem projetados oferecem desempenho superior. Agentes compilados podem alcançar maior rendimento do que microsserviços tradicionais e adicionar raciocínio para detecção de fraude.
  • Confiabilidade de nível empresarial: os frameworks agênticos permitem uma integração robusta. Um sistema de cadeia de suprimentos pode processar milhares de transações e lidar com inconsistências de dados sem problemas.
  • Tratamento superior de erros: os agentes de IA combinam caminhos de recuperação com raciocínio. O sistema de processamento de pedidos mantém alta disponibilidade por meio de caminhos otimizados para tratamento de erros e raciocínio para novas falhas.
  • Arquitetura pronta para o futuro: as organizações se beneficiam hoje enquanto se posicionam para o amanhã. Agentes compilados com camadas de raciocínio otimizam o desempenho atual e abrem caminho para futuros avanços de IA.

Estratégia de implementação: uma abordagem que prioriza o desempenho

As organizações precisam de uma estratégia de implementação prática que mantenha os padrões corporativos e, ao mesmo tempo, capture os benefícios da IA:

  • Perfil de desempenho: Identifique microsserviços com caminhos críticos de desempenho e pontos de decisão complexos que se beneficiariam de recursos de raciocínio.
  • Projeto da arquitetura: crie projetos de agentes que separem os caminhos críticos de desempenho (implementados em código compilado) dos componentes de raciocínio que tratam casos edge.
  • Seleção de frameworks: avalie os frameworks agênticos com base em benchmarks de desempenho, compatibilidade de linguagem com sistemas existentes e opções de compilação.
  • Aprimoramento das equipes: crie equipes de engenharia que combinem o conhecimento tradicional de desenvolvimento de software com as habilidades de engenharia de IA.
  • Implementação sistemática: implemente e teste benchmarks de desempenho rigorosos juntamente com recursos de raciocínio.

Implementar uma abordagem que prioriza o desempenho pode ajudar as organizações a obter benefícios operacionais enquanto desenvolvem recursos estratégicos de IA.

Avaliações e desenvolvimento orientado por avaliações

A engenharia de qualidade dos agentes de IA exige uma abordagem fundamentalmente diferente dos testes de software tradicionais. Empresas líderes em arquitetura agêntica foram pioneiras no desenvolvimento orientado por eval, metodologia que garante que os agentes atendam tanto aos requisitos funcionais quanto aos padrões de raciocínio.

O framework de avaliação

Avaliações são pacotes de testes especializados projetados para avaliar o comportamento do agente em várias dimensões:

  • Avaliações funcionais: verifique os principais recursos dos negócios por meio de asserções de entrada/saída.
  • Avaliações de raciocínio: avalie a qualidade das decisões e as abordagens de resolução de problemas.
  • Avaliações comportamentais: teste o alinhamento com as diretrizes organizacionais e normas éticas.
  • Avaliações de desempenho: meça os tempos de resposta, a produtividade e o uso de recursos.
  • Avaliações de adversários: desafie os agentes com casos extremos e modos de falha potenciais.

Dados internos de alguns provedores de nuvem, dados e IA mostram uma redução significativa nos incidentes de produção após a implementação de avaliações multidimensionais para seus sistemas de agentes.

Implementação do desenvolvimento orientado por avaliações

Um processo maduro de desenvolvimento orientado por avaliação inclui esses elementos-chave:

1. Protocolo de definição de avaliação

Comece definindo expectativas em todas as dimensões. Para cada agente:

  • Documente as funcionalidades principais esperadas com critérios claros de sucesso
  • Especifique os padrões de raciocínio que os agentes devem demonstrar
  • Estabeleça limites de comportamento e barreiras
  • Defina limites de desempenho com base nos requisitos comerciais

2. Pipelines de avaliação contínua

Crie pipelines automatizados que executam avaliações durante todo o ciclo de vida do desenvolvimento:

  • As avaliações pré-compromisso identificam problemas antes da integração do código
  • As avaliações de integração verificam as interações dos agentes
  • Teste de avaliações em estapas com dados de produção
  • O monitoramento da produção valida continuamente os agentes implementados

3. Geração dinâmica de testes

Vá além dos casos de teste estáticos com cenários gerados dinamicamente:

  • Use grandes modelos de linguagem (LLMs) para criar casos de teste diversos que enfatizam o raciocínio dos agentes
  • Gere variações de casos extremos conhecidos
  • Simule novas entradas com base em padrões de produção

4. Avaliação colaborativa humano-IA

Combine testes automatizados com conhecimento humano:

  • Revisores especializados avaliam o raciocínio dos agentes em cenários complexos
  • Pesquisadores de UX avaliam a qualidade da interação humano-agente
  • Os especialistas em domínio verificam a correção da lógica comercial

5. Prevenção da regressão

Evite regressão de recursos com:

  • Pacotes de avaliação abrangentes que crescem com cada problema descoberto
  • Comparações A/B entre versões de agentes
  • Monitoramento contínuo dos principais indicadores de desempenho

Um estudo de 2024 do Instituto Stanford para IA Centrada no Ser Humano (HAI) constatou que as empresas que utilizam frameworks de avaliação abrangentes experimentam ciclos de desenvolvimento 65% mais rápidos e 42% menos reversões de produção.

Estudo de caso: implementação de serviços financeiros

Um dos dez maiores bancos globais implementou o desenvolvimento orientado por avaliação para seus agentes de atendimento ao cliente com resultados impressionantes.

A abordagem deles se concentrava em um framework de avaliação de três níveis: pacotes de testes para validação funcional, avaliações para cenários de decisão complexos e avaliações de especialistas para interações de alto risco.

O framework descobriu problemas sutis que os testes tradicionais deixariam passar. Por exemplo, um agente aprovou corretamente pedidos de empréstimo de acordo com a política, mas usou um raciocínio que inadvertidamente reforçou o viés em casos limite, um problema identificado por suas avaliações de raciocínio antes da implementação.

Estratégias de otimização de custos para arquitetura agêntica

A viabilidade econômica das arquiteturas agênticas depende de estratégias eficazes de gerenciamento de custos. Embora os agentes de IA forneçam um valor comercial significativo, o gerenciamento das despesas operacionais continua sendo um fator crítico de sucesso.

O desafio econômico

Em relação ao custo, as organizações enfrentam duas considerações principais:

Custos de tokens: cada interação com modelos de base incorre em cobranças por tokens, que se acumulam rapidamente em escala. Redes de agentes complexas com raciocínio em várias etapas podem gerar de 10 a 15 vezes mais tokens do que chamadas de APIs diretas semelhantes.

Custos de computação: a execução de inferência, especialmente para raciocínio sofisticado, exige recursos computacionais substanciais. Clusters de GPU no local para inferência normalmente exigem um grande investimento inicial. A inferência baseada na nuvem pode incorrer em custos mensais que variam de US$ 10.000 a US$ 50.000 para implementações de escala pequena a moderada.

Abordagens eficazes para otimização

As principais organizações desenvolveram abordagens sistemáticas para gerenciar esses custos.

1. Otimização arquitetônica

  • Projeto de agente híbrido que encaminha decisões complexas para modelos de base
  • Quantização de modelos para implementação em produção
  • Armazenamento em cache estratégico de respostas para consultas comuns

O JPMorgan Chase reduziu seus custos de inferência em 67% por meio de arquitetura híbrida que processa 89% das transações por meio de caminhos determinísticos, reservando recursos de LLMs para cenários complexos.

2. Ajuste de engenharia de prompts para eficiência

  • Precisão no projeto de instruções para minimizar o uso de tokens
  • Poda contextual que elimina informações desnecessárias
  • Otimização do formato de resposta para reduzir a geração de tokens

3. Otimização de inferência

  • Implementação de cache de chave-valor (KV) para interações repetidas
  • Processamento em lote para operações não urgentes
  • Dimensionamento correto da infraestrutura de implementação para padrões de cargas de trabalho

4. Implementação da RAG

  • Geração aumentada de recuperação estratégica para reduzir o tamanho do contexto
  • Otimização do banco de dados de vetores para acesso eficiente às informações
  • Técnicas de destilação de contexto que compactam informações relevantes

5. Ajuste fino para especialização de domínio

  • Criação de modelos específicos de domínio com contagem reduzida de parâmetros
  • Destilação de modelos gerais em variantes especializadas eficientes
  • Abordagens de ajuste eficientes em termos de parâmetros, como LoRA e QLoRA

O relatório de economia de IA de 2024 da McKinsey afirma que a implementação de três ou mais dessas estratégias reduz seus custos operacionais de IA em média de 62%, mantendo ou melhorando os recursos do sistema. 

Desafios de implementação

As arquiteturas agênticas introduzem novas considerações de implementação.

Complexidade da orquestração
A coordenação de agentes autônomos exige abordagens diferentes da orquestração tradicional de microsserviços:

  • A tomada de decisão descentralizada exige uma coordenação sofisticada
  • Vários agentes devem trabalhar em direção a objetivos comuns
  • O estado do sistema se torna mais complexo com alterações assíncronas

Frameworks modernos lidam com esses desafios por meio de sistemas de priorização e contexto compartilhado. O Semantic Kernel da Microsoft implementa uma orquestração que equilibra a autonomia dos agentes com a coerência do sistema.

Observabilidade e monitoramento
As abordagens tradicionais de monitoramento precisam evoluir:

  • Os sistemas precisam capturar caminhos de raciocínio e critérios de decisão
  • A análise de dados comportamental ajuda a identificar padrões nas interações dos agentes
  • O monitoramento preditivo antecipa possíveis estados do sistema

Segurança e governança
as arquiteturas agênticas introduzem novas dimensões de segurança:

  • Mecanismos para verificar as instruções do agente com as políticas organizacionais
  • Sistemas para validar ações do agente antes da execução
  • Recursos para inspecionar o raciocínio do agente quanto à conformidade

Comparação de microsserviços versus sistemas agênticos: um caso de uso prático

Para ilustrar a diferença entre microsserviços e arquiteturas agênticas, considere uma plataforma de comércio de serviços financeiros.

Implementação tradicional de microsserviços:

  • Um serviço de contas gerencia as informações e os saldos dos clientes
  • Um serviço de negociação executa ordens com base em solicitações explícitas
  • Um serviço de dados de mercado fornece preços quando consultado
  • Um serviço de notificação envia alertas após eventos predefinidos
  • Um serviço de gerenciamento de risco aplica verificações baseadas em regras

Quando um cliente faz uma negociação, o sistema segue um caminho predeterminado, com cada etapa ocorrendo quando explicitamente acionada.

Implementação agêntica:

  • Um agente de portfólio monitora continuamente as participações e sugere oportunidades de reequilíbrio
  • Um agente de execução de negociação seleciona o momento ideal com base nas condições do mercado
  • Um agente de avaliação de risco avalia proativamente a volatilidade do mercado
  • Um agente de comunicação fornece informações relevantes por meio de canais preferenciais

Na prática, a implementação agêntica cria experiências do cliente fundamentalmente diferentes. Quando a volatilidade do mercado aumenta, o agente de avaliação de risco pode ajustar de forma autônoma os limites de negociação e notificar o agente do portfólio, que analisa os ativos dos clientes em busca de potenciais vulnerabilidades. O sistema demonstra inteligência além do que foi explicitamente codificado.

Olhando para o futuro: engenharia de plataforma para escala agêntica

A progressão de arquiteturas monolíticas para serviços, depois para microsserviços e, finalmente, para agentes, segue padrões históricos claros. Cada evolução trouxe componentes mais granulares com crescente inteligência e autonomia.

Organizações que implementam arquiteturas agênticas em escala devem adotar princípios de engenharia de plataforma para alcançar qualidade consistente, eficiência de custos e controle em todo o portfólio de aplicação.

Adoção orientada por plataformas

Organizações com visão de futuro usam plataformas internas de desenvolvedores (IDPs) para acelerar a adoção agêntica.

Infraestrutura de agentes padronizada

  • Modelos de agentes pré-configurados com monitoramento integrado
  • Padrões de implementação de golden-path para tipos comuns de agentes
  • Implementação de autoatendimento com portas de qualidade automatizadas

Observabilidade unificada

  • Monitoramento centralizado do desempenho e comportamento do agente
  • Rastreamento e visualização de interações entre agentes
  • Detecção automatizada de anomalias com análise da causa raiz

Foco na experiência do desenvolvedor

  • Ferramentas de autoatendimento para desenvolvimento e teste de agentes
  • Ambientes de desenvolvimento integrados com depuração de agentes especializados
  • Verificações automatizadas de conformidade durante o desenvolvimento

Governança em escala

  • Gerenciamento e aplicação centralizados de políticas
  • Avaliação automatizada do comportamento do agente em relação às normas
  • Trilhas de auditoria abrangentes para todas as ações do agente

O relatório de engenharia de plataforma da Gartner de 2024 afirma que abordagens de plataforma maduras levam a um tempo de lançamento no mercado 3,2 vezes mais rápido para novos recursos de agentes e uma satisfação de desenvolvedor 76% maior. 

As organizações agora se deparam com uma escolha: liderar na adoção da arquitetura agêntica para casos de uso apropriados ou seguir os concorrentes que capturam vantagens iniciais. As evidências sugerem que os pioneiros que implementam abordagens baseadas em plataformas obtêm vantagens competitivas substanciais em velocidade de desenvolvimento, flexibilidade do sistema e recursos.

Soluções relacionadas
IBM® watsonx.ai

Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em menos tempo com menos dados.

Explore o watsonx.ai
Soluções de inteligência artificial

Coloque a IA em ação na sua empresa com a experiência em IA líder do setor e com o portfólio de soluções da IBM.

Explore as soluções de IA
Consultoria e serviços em inteligência artificial (IA)

Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

Explore os serviços de IA
Dê o próximo passo

Obtenha acesso completo aos recursos que abrangem o ciclo de vida do desenvolvimento da IA. Produza soluções poderosas de IA com interfaces fáceis de usar, fluxos de trabalhos e acesso a APIs e SDKs padrão do setor.

Explore o watsonx.ai Agende uma demonstração em tempo real