O que são protocolos de agentes de IA?

Autores

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

Os protocolos de agentes de IA estabelecem padrões de comunicação entre agentes de inteligência artificial e entre agentes de IA e outros sistemas. Esses protocolos especificam a sintaxe, a estrutura e a sequência de mensagens, juntamente com convenções de comunicação, como os papéis que os agentes desempenham nas conversas e quando e como respondem às mensagens.

Os sistemas de IA baseados em agentes geralmente são executados em silos. Eles são desenvolvidos por diferentes provedores usando diversos frameworks de Agente de IA e empregando arquiteturas agênticas distintas. A integração com o mundo real se torna um desafio, e o acoplamento desses sistemas fragmentados requer conectores personalizados para todos os tipos possíveis de interação do agente.

É aqui que os protocolos entram. Elas transformam sistemas multiagentes díspares em um ecossistema interligado, onde agentes impulsionados por IA compartilham uma maneira de descobrir, entender e colaborar uns com os outros.

Embora os protocolos agênticos façam parte da orquestração de agentes de IA, eles não atuam como orquestradores. Elas padronizam a comunicação, mas não gerenciam a coordenação, execução e otimização do fluxo de trabalho agêntico.

Benefícios dos protocolos de agentes de IA

Os protocolos de agentes de IA oferecem estas vantagens:

  • Interoperabilidade

  • Redução da complexidade do desenvolvimento de agentes

  • Padronização e integração mais tranquilas

Interoperabilidade

Os protocolos de agentes eliminam silos, permitindo que a IA agêntica se comunique entre si, independentemente de sua própria implementação subjacente. Eles facilitam a colaboração perfeita dos agentes em diversos dispositivos, ambientes e plataformas.

Redução da complexidade do desenvolvimento de agentes

Como os protocolos lidam com as complexidades da interação agêntica e abstraem complexidades por meio de kits de desenvolvimento de software (SDKs), eles ajudam a simplificar o processo de criação de sistemas multiagentes. Os desenvolvedores de IA podem se concentrar mais na criação de novas funcionalidades do agente e no aprimoramento das existentes.

Padronização e integração mais tranquilas

Os protocolos de agentes de IA oferecem um meio de comunicação definido e estruturado. E como muitos desses protocolos padronizados são construídos sobre tecnologias estabelecidas, eles ajudam a garantir a compatibilidade com as stacks de tecnologia atuais, tornando a integração mais tranquila.

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.

Exemplos de protocolos de agentes de IA

Muitos protocolos ainda estão em seus estágios iniciais; portanto, ainda não foram amplamente utilizados ou aplicados em grande escala. Essa falta de maturidade significa que as organizações devem estar preparadas para atuar como pioneiras, ajustando-se a grandes mudanças e especificações em evolução.

À medida que a tecnologia agêntica evolui, podem surgir novos protocolos. Veja aqui alguns protocolos atuais de agentes de IA:

  • Protocolo Agent2Agent (A2A)

  • Protocolo de comunicação de agentes (ACP)

  • Protocolo de rede de agentes (ANP)

  • Protocolo de interação agente-usuário (AG-UI)

  • Agora

  • Protocolo LMOS

  • Protocolo de contexto do modelo (MCP) 

Um fluxograma que ilustra a interação entre um usuário, a IU do aplicação/sistema e o sistema multiagentes.

Protocolo Agent2Agent (A2A)

O protocolo A2A é um padrão aberto para comunicação de agentes de IA lançado inicialmente pelo Google e agora gerenciado sob a Linux Foundation. Ele segue uma configuração de modelo cliente-servidor com um fluxo de trabalho de três etapas:

  1. A descoberta ocorre quando uma entidade (um usuário humano ou outro agente de IA) inicia uma solicitação de tarefa a um agente cliente, que então procura agentes remotos para determinar o mais adequado.
  2. Depois que o agente cliente identifica um agente remoto capaz de cumprir a tarefa, ele passa por autenticação. O agente remoto é responsável pela autorização e concessão de permissões controle de acesso.
  3. A comunicação continua com o agente cliente enviando a tarefa e o agente remoto processando-a. A comunicação entre agentes ocorre por meio de HTTPS para transporte seguro, com JSON-RPC (Remote Procedure Call) 2.0 como formato para troca de dados.

Protocolo de comunicação de agentes (ACP)

Assim como o A2A, o Agent Communication Protocol (ACP) é outro padrão aberto para comunicação entre agentes, inicialmente introduzido pelo BeeAI da IBM e agora parte da Linux Foundation.

Seus principais componentes incluem um cliente ACP e um servidor ACP. O cliente ACP envia solicitações ao servidor ACP por meio de uma API RESTful sobre HTTP. O servidor ACP hospeda um ou mais agentes em um único endpoint HTTP e roteia tarefas para o agente apropriado.

Aqui estão as outras características principais do ACP:

  • O protocolo pode ser usado com ferramentas HTTP padrão, como o Postman, ou até mesmo um navegador, mas também há SDKs disponíveis.

  • A descoberta pode acontecer online, consultando diretamente os servidores ACP e arquivos de manifesto público em URLs conhecidas. A descoberta offline ocorre por meio de um registro centralizado ou pelo embedding de metadados do agente diretamente em seus pacotes de distribuição.

  • O ACP aceita diferentes tipos de mensagens, como áudio, imagens, texto, vídeo ou formatos binários personalizados.

Protocolo de rede de agentes (ANP)

O Agent Network Protocol (ANP) é um protocolo de código aberto cujo objetivo é ser "o HTTP da era da web agêntica". Dessa forma, ele emprega HTTP para transporte de dados e JSON-LD (JSON for Linked Data) para formatação de dados.

O ANP adota uma arquitetura ponto a ponto composta por três camadas:

  • A camada de identidade implementa tanto a criptografia de ponta a ponta para comunicação segura quanto a autenticação de identidade descentralizada com base no padrão W3C DID (Descentralized Identifiers).

  • A camada de metaprotocolo permite que os agentes negociem e concordem sobre como se comunicar.

  • A camada de protocolo de aplicação permite que agentes autônomos descrevam seus recursos e é compatível com a descoberta de agentes.

Protocolo de interação agente-usuário (AG-UI)

O protocolo de Interação Agente-Usuário (AG-IU) pretende padronizar a forma como os Agentes de IA de back-end se conectam a aplicações de front-end ou voltadas para o usuário. Foi projetado para interação humano-agente em tempo real, como bater-papo com assistentes de IA e chatbots, atualizações de estado de transmissão em tempo real e outras automações agênticas que envolvem uma abordagem human-in-the-loop.

A arquitetura baseada em eventos da IU do AG permite que os agentes de IA produzam eventos com base em determinados gatilhos do sistema ou entradas dos usuários. O protocolo define uma série de categories de eventos, incluindo aqueles para envio e recebimento de mensagens, chamadas de ferramentas e realização de tarefas.

Sua camada de middleware é compatível com vários métodos de transporte, como eventos enviados pelo servidor (SSE), webhooks e WebSockets. O AG-UI também permite que um proxy seguro encaminhe as solicitações com segurança entre agentes e interfaces de usuário.

Agora

Agora é um protocolo de comunicação para agentes que utilizam grandes modelos de linguagem (LLMs). Ele se baseia em alguns recursos principais do agente de LLM: natural language understanding, acompanhamento de instruções, escrita e execução de código e negociação autônoma.

Os agentes de LLM podem implementar e ser compatíveis com seus próprios protocolos, que descrevem em texto simples em um documento de protocolo. A primeira parte do documento contém metadados que identificam o nome do protocolo, a descrição e se é para uma ou várias rodadas de conversa. A segunda parte descreve como ocorre a comunicação, com instruções em uma mistura de linguagem natural e código. Então, os agentes são deixados para negociar de forma autônoma qual protocolo adotar.

O Agora emprega HTTPS para transmitir dados e JSON para formatação. Ele também usa um sistema de identificação baseado em hash para documentos de protocolo.

Protocolo LMOS

Desenvolvido pela Eclipse Foundation, o protocolo Language Model Operating System (LMOS) visa inaugurar uma Internet dos agentes (IoA), um ecossistema multiagentes em escala de internet. Semelhante ao ANP, sua arquitetura estruturada consiste em três camadas:

  • A camada de identidade e segurança fornece comunicação criptografada e é compatível com diferentes esquemas de autenticação, como W3C DID e OAuth 2.0.

  • A camada de protocolo de transporte permite que os agentes escolham e adaptem o protocolo de transporte mais adequado à sua finalidade para cada interação.

  • A camada de protocolo de aplicação descreve formatos para descrições de agentes e ferramentas, métodos de descoberta, um modelo de dados semântico e um subprotocolo websocket.

O protocolo LMOS usa JSON-LD para descrever recursos de ferramentas e agentes e outros metadados. A descoberta acontece de forma dinâmica, consultando um diretório central ou por meio de redes descentralizadas.

Protocolo de contexto do modelo (MCP)

Lançado pela Anthropic, o Model Context Protocol (MCP) fornece uma maneira padronizada para modelos de IA obterem o contexto de que precisam para realizar tarefas. No domínio agêntico, o MCP atua como uma camada para os agentes de IA se conectarem e se comunicarem com serviços e ferramentas externas, como APIs, bancos de dados, arquivos, pesquisas na web e outras fontes de dados.

O MCP engloba estes três elementos arquitetônicos principais:

  • O host MCP contém lógica de orquestração e pode conectar cada cliente MCP a um servidor MCP. Pode hospedar vários clientes.

  • Um cliente MCP converte solicitações de usuário em um formato estruturado que o protocolo pode processar. Cada cliente tem uma relação um-para-um com um servidor MCP. Os clientes gerenciam sessões, analisam e verificam respostas e lidam com erros.

  • O servidor MCP converte solicitações de usuários em ações de servidor. Normalmente, os servidores são repositórios do GitHub, disponíveis em várias linguagens de programação e dão acesso a ferramentas. Eles também podem ser usados para conectar a inferência do LLM ao MCP SDK por meio de provedores de plataforma de IA, como IBM e OpenAI.

Na camada de transporte entre clientes e servidores, as mensagens são transmitidas no formato JSON-RPC 2.0 usando a entrada/saída padrão (stdio) para mensagens leves e síncronas ou SSE para chamadas assíncronas impulsionadas por eventos.

Agentes de IA

Cinco tipos de agentes de IA: funções autônomas e aplicações no mundo real

Saiba como a IA orientada por objetivos e baseada em utilidade se adapta a fluxos de trabalho e ambientes complexos.

Fatores a serem considerados ao escolher um protocolo de agentes de IA

Com a falta de benchmarks para avaliação padronizada, as empresas devem realizar sua própria avaliação do protocolo que melhor atende às suas necessidades de negócios. Elas podem precisar começar com um caso de uso pequeno e controlado, combinado com testes completos e rigorosos.

Aqui estão alguns aspectos a serem lembrados ao avaliar protocolos de agentes:

  • Eficiência

  • Confiabilidade

  • Escalabilidade

  • Segurança

Eficiência

Idealmente, os protocolos são projetados para limitar a latência, resultando em transferência de dados rápida e tempos de resposta rápidos. Embora seja esperada alguma sobrecarga de comunicação, ela deve ser mantida no mínimo.

Confiabilidade

Os protocolos de agentes de IA devem ser capazes de lidar com mudanças nas condições de rede em todos os fluxos de trabalho agênticos, com mecanismos implementados para gerenciar falhas ou interrupções. Por exemplo, o ACP é projetado com comunicação assíncrona como padrão, o que atende a tarefas complexas ou de longa duração. Enquanto isso, o A2A é compatível com a transmissão em tempo real usando SSE para saídas grandes ou longas ou atualizações contínuas de status.

Escalabilidade

Os protocolos devem ser robustos o suficiente para atender a ecossistemas de agentes em crescimento sem uma queda em seu desempenho. Avaliar a escalabilidade pode incluir aumentar o número de agentes ou links para ferramentas externas ao longo de um período de tempo, de forma gradual ou repentina, para observar como um protocolo opera nessas condições.

Segurança

A manutenção da segurança é fundamental, e os protocolos de agentes estão incorporando cada vez mais proteções de segurança. Isso inclui autenticação, criptografia e controle de acesso.

Soluções relacionadas
Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

    Explore o watsonx Orchestrate
    Soluções de agentes de IA da IBM

    Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

    Explore soluções de agentes de IA
    Serviços de IA do IBM® Consulting

    Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

    Explore os serviços de inteligência artificial
    Dê o próximo passo

    Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

    Explore o watsonx Orchestrate Explore o watsonx.ai