¿Qué son los protocolos de agentes de IA?

Autores

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

Los protocolos de agentes de IA establecen estándares de comunicación entre agentes de inteligencia artificial y entre agentes de IA y otros sistemas. Estos protocolos especifican la sintaxis, la estructura y la secuencia de los mensajes, junto con las convenciones de comunicación, como los roles que asumen los agentes en las conversaciones y cuándo y cómo responden a los mensajes.

Los sistemas de IA basados en agentes a menudo se ejecutan en silos. Están creados por diferentes proveedores que utilizan diversas infraestructuras de agentes de IA y emplean arquitecturas de agentes distintas. La integración en el mundo real se convierte en un desafío, y acoplar estos sistemas fragmentados requiere conectores personalizados para todos los tipos posibles de interacción entre agentes.

Aquí es donde entran los protocolos. Convierten sistemas de múltiples agentes dispares en un ecosistema interconectado donde los agentes impulsados por IA comparten una forma de descubrir, comprender y colaborar entre sí.

Si bien los protocolos agénticos forman parte de la orquestación de agentes de IA, no actúan como orquestadores. Estandarizan la comunicación, pero no gestionan la coordinación, ejecución y optimización del flujo de trabajo agéntico.

Beneficios de los protocolos de agentes de IA

Los protocolos de agente de IA ofrecen estas ventajas:

  • Interoperabilidad

  • Reducción de la complejidad del desarrollo de agentes

  • Estandarización e integración más fluida

Interoperabilidad

Los protocolos de agente rompen los silos, lo que permite que la IA agéntica se comunique entre sí independientemente de su propia implementación subyacente. Facilitan la colaboración fluida de los agentes en diferentes dispositivos, entornos y plataformas.

Reducción de la complejidad del desarrollo de agentes

Debido a que los protocolos abordan las complejidades de la interacción agentiva y abstraen las complejidades a través de kits de desarrollo de software (SDK), ayudan a agilizar el proceso de creación de sistemas multiagente. Los desarrolladores de IA pueden centrarse más en crear nuevas funcionalidades de agentes y mejorar las existentes.

Estandarización e integración más fluida

Los protocolos de agentes de IA ofrecen un medio de comunicación establecido y estructurado. Y dado que muchos de estos protocolos estandarizados se basan en tecnologías establecidas, ayudan a garantizar la compatibilidad con las pilas de tecnología actuales, lo que facilita la integración empresarial.

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Ejemplos de protocolos de agentes de IA

Muchos protocolos aún se encuentran en sus primeras etapas, por lo que aún no se han utilizado o aplicado ampliamente a gran escala. Esta falta de madurez significa que las organizaciones deben estar preparadas para actuar como primeros usuarios, ajustándose a los cambios de última hora y a las especificaciones en evolución.

A medida que la tecnología agentiva evoluciona, pueden surgir nuevos protocolos. Estos son algunos protocolos actuales de agentes de IA:

  • Protocolo Agent2Agent (A2A)

  • Protocolo de comunicación de agentes (ACP)

  • Protocolo de red de agentes (ANP)

  • Protocolo de interacción agente-usuario (AG-UI)

  • Agora

  • Protocolo LMOS

  • Protocolo de contexto del modelo (MCP) 

Un diagrama de flujo que ilustra la interacción entre un usuario, la interfaz de usuario de la aplicación/sistema y el sistema multiagente.

Protocolo Agent2Agent (A2A)

El protocolo A2A es un estándar abierto para la comunicación de agentes de IA lanzado inicialmente por Google y ahora gestionado bajo la Fundación Linux. Sigue una configuración de modelo cliente-servidor con un flujo de trabajo de tres pasos:

  1. El descubrimiento ocurre cuando una entidad (un usuario humano u otro agente de IA) inicia una solicitud de tarea a un agente cliente, que luego busca agentes remotos para determinar la mejor opción.
  2. Una vez que el agente del cliente identifica un agente remoto capaz de realizar la tarea, pasa por la autenticación. El agente remoto es responsable de la autorización y concesión de permisos de control de acceso.
  3. La comunicación continúa con el agente del cliente enviando la tarea y el agente remoto procesándola. La comunicación de agente a agente se realiza a través de HTTPS para un transporte seguro, con JSON-RPC (llamada a procedimiento remoto) 2.0 como formato para el intercambio de datos.

Protocolo de comunicación de agentes (ACP)

Al igual que A2A, el protocolo de comunicación de agentes (ACP) es otro estándar abierto para la comunicación de agente a agente, introducido inicialmente por BeeAI de IBM y ahora parte de la Fundación Linux.

Sus componentes principales incluyen un cliente ACP y un servidor ACP. El cliente ACP envía solicitudes al servidor ACP a través de una API RESTful a través de HTTP. El servidor ACP aloja uno o más agentes detrás de un único endpoint HTTP y enruta las tareas al agente adecuado.

Estas son otras características clave de ACP:

  • El protocolo se puede utilizar con herramientas HTTP estándar como Postman o incluso un navegador, pero también hay SDK disponibles.

  • El descubrimiento puede ocurrir en línea consultando los servidores ACP directamente y los archivos de manifiesto públicos en URL conocidas. El descubrimiento sin conexión se produce a través de un registro centralizado o mediante la incorporación de metadatos de agentes directamente en sus paquetes de distribución.

  • ACP acepta diferentes tipos de mensajes, como audio, imágenes, texto, video o formatos binarios personalizados.

Protocolo de red de agentes (ANP)

El Agent Network Protocol (ANP) es un protocolo de código abierto cuyo objetivo es ser "el HTTP de la era de la web agentiva". Como tal, emplea HTTP para el transporte de datos y JSON-LD (JSON para datos vinculados) para el formateo de datos.

ANP adopta una arquitectura peer-to-peer compuesta por tres capas:

  • La capa de identidad implementa tanto el cifrado de extremo a extremo para la comunicación segura como la autenticación de identidad descentralizada basada en el estándar W3C DID (Identificadores Descentralizados).

  • La capa de metaprotocolo permite a los agentes negociar y acordar cómo comunicarse.

  • La capa de protocolo de aplicación permite a los agentes autónomos describir sus capacidades y proporciona soporte para el descubrimiento de agentes.

Protocolo de interacción agente-usuario (AG-UI)

El protocolo de interacción agente-usuario (AG-UI) pretende estandarizar la forma en que los agentes de IA de back-end se conectan a las aplicaciones de front-end o orientadas al usuario. Está diseñado para la interacción humano-agente en tiempo real, como chatear con asistentes de IA y chatbots, actualizaciones de estado de transmisión en vivo y otras automatizaciones agénticas que conllevan un enfoque de intermediario.

La arquitectura basada en eventos de AG-interfaz de usuario (IU) permite a los agentes de IA producir eventos basados en ciertos activadores del sistema o entradas de los usuarios. El protocolo define un número de categories de eventos, incluidas aquellas para enviar y recibir mensajes, llamar a herramientas y realizar tareas.

Su capa de middleware admite varios métodos de transporte, como eventos enviados por el servidor (SSE), webhooks y WebSockets. AG-UI también permite que un proxy seguro enrute las solicitudes de forma segura entre los agentes y las interfaces de usuario.

Agora

Agora es un protocolo de comunicación para agentes impulsado por modelos de lenguaje de gran tamaño (LLM). Se basa en algunas capacidades del agente LLM: natural language understanding, seguimiento de instrucciones, escritura y ejecución de código y negociación autónoma.

Los agentes de LLM pueden implementar y admitir sus propios protocolos, que describen en texto sin formato dentro de un documento de protocolo. La primera parte del documento contiene metadatos que identifican el nombre del protocolo, la descripción y si es para una o varias rondas de conversación. La segunda parte describe cómo se lleva a cabo la comunicación, con instrucciones en una combinación de lenguaje natural y código. Luego, se deja que los agentes negocien de forma autónoma qué protocolo adoptar.

Agora emplea HTTPS para transmitir datos y JSON para formatear. También utiliza un sistema de identificación basado en hash para documentos de protocolo.

Protocolo LMOS

Desarrollado por Eclipse Foundation, el protocolo Language Model Operating System (LMOS) tiene como objetivo marcar el comienzo de un Internet de agentes (IoA), un ecosistema de múltiples agentes a escala de Internet. Al igual que ANP, su arquitectura estructurada consta de tres capas:

  • La capa de identidad y seguridad proporciona comunicación cifrada y admite diferentes esquemas de autenticación, como W3C DID y OAuth 2.0.

  • La capa de protocolo de transporte permite a los agentes elegir y adaptar el protocolo de transporte que se adapte a su propósito para cada interacción.

  • La capa de protocolo de aplicación describe formatos para descripciones de agentes y herramientas, métodos de descubrimiento, un modelo de datos semántico y un subprotocolo websocket.

El protocolo LMOS utiliza JSON-LD para describir las capacidades de herramientas y agentes y otros metadatos. El descubrimiento ocurre de forma dinámica, consultando un directorio central o a través de redes descentralizadas.

Protocolo de contexto del modelo (MCP)

Presentado por Anthropic, el Model Context Protocol (MCP) proporciona una forma estandarizada para que los modelos de IA obtengan el contexto que necesitan para llevar a cabo las tareas. En el ámbito de los agentes, MCP actúa como un nivel para que los agentes de IA se conecten y se comuniquen con servicios y herramientas externos, como API, bases de datos, archivos, búsquedas web y otras fuentes de datos.

MCP abarca estos tres elementos arquitectónicos clave:

  • El host MCP contiene lógica de orquestación y puede conectar cada cliente MCP a un servidor MCP. Puede alojar varios clientes.

  • Un cliente MCP convierte las solicitudes de los usuarios en un formato estructurado que el protocolo puede procesar. Cada cliente tiene una relación uno a uno con un servidor MCP. Los clientes gestionan sesiones, analizan y verifican respuestas y manejan errores.

  • El servidor MCP convierte las solicitudes de los usuarios en acciones del servidor. Los servidores suelen ser repositorios de GitHub disponibles en varios lenguajes de programación y proporcionan acceso a herramientas. También se pueden utilizar para conectar la inferencia LLM al SDK de MCP a través de proveedores de plataformas de IA, como IBM y OpenAI.

En la capa de transporte entre clientes y servidores, los mensajes se transmiten en formato JSON-RPC 2.0 utilizando entrada/salida estándar (stdio) para mensajería ligera y sincrónica o SSE para llamadas asincrónicas basadas en eventos.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones reales

Descubra cómo la IA orientada a objetivos y basada en utilidades se adapta a los flujos de trabajo y entornos complejos.

Factores a considerar al elegir un protocolo de agente de IA

Con la falta de puntos de referencia para la evaluación estandarizada, las empresas deben realizar su propia evaluación del protocolo que mejor se adapte a sus necesidades comerciales. Es posible que deban comenzar con un caso de uso pequeño y controlado combinado con pruebas exhaustivas y rigurosas.

Estos son algunos aspectos a tener en cuenta al evaluar los protocolos de los agentes:

  • Eficiencia

  • Confiabilidad

  • Escalabilidad

  • Seguridad

Eficiencia

Idealmente, los protocolos están diseñados para limitar la latencia, lo que resulta en una transferencia de datos rápida y tiempos de respuesta rápidos. Si bien se espera cierta sobrecarga de comunicación, debe mantenerse al mínimo.

Confiabilidad

Los protocolos de agentes de IA deben ser capaces de manejar las condiciones cambiantes de la red a través de flujos de trabajo de agentes, con mecanismos implementados para gestionar fallas o interrupciones. Por ejemplo, ACP está diseñado con comunicación asíncrona por defecto, lo que se adapta a tareas complejas o de larga duración. Mientras tanto, A2A admite la transmisión en tiempo real mediante SSE para salidas grandes o largas o actualizaciones de estado continuas.

Escalabilidad

Los protocolos deben ser lo suficientemente sólidos como para atender a los ecosistemas de agentes en crecimiento sin que disminuya su rendimiento. La evaluación de la escalabilidad puede incluir aumentar la cantidad de agentes o enlaces a herramientas externas durante un período de tiempo, ya sea de forma gradual o repentina, para observar cómo funciona un protocolo en esas condiciones.

Seguridad

Mantener la seguridad es primordial, y los protocolos de los agentes incorporan cada vez más medidas de seguridad. Estos incluyen autenticación, cifrado y control de acceso.

Soluciones relacionadas
Agentes de IA para empresas

Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

    Explore watsonx Orchestrate
    Soluciones de agentes de IA de IBM

    Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.

    Explorar las soluciones de agentes de IA
    Servicios de IA de IBM Consulting

    Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

    Explorar los servicios de inteligencia artificial
    Dé el siguiente paso

    Ya sea que elija personalizar aplicaciones y habilidades predefinidas o crear y desplegar servicios agénticos personalizados utilizando un estudio de IA, la plataforma IBM watsonx responde a sus necesidades.

    Explore watsonx Orchestrate Explore watsonx.ai