¿Qué son los protocolos de agentes de IA?

Autores

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

Los protocolos de agentes de IA establecen estándares de comunicación entre agentes de inteligencia artificial y entre agentes de IA y otros sistemas. Estos protocolos especifican la sintaxis, la estructura y la secuencia de los mensajes, junto con convenciones de comunicación como los roles que asumen los agentes en las conversaciones y cuándo y cómo responden a los mensajes.

Los sistemas de IA basados en agentes suelen funcionar en silos. Los crean diferentes proveedores que utilizan diversos marcos de agentes de IA y emplean arquitecturas de agentes distintas. La integración en el mundo real se convierte en un reto, y el acoplamiento de estos sistemas fragmentados requiere conectores personalizados para todos los tipos posibles de interacción entre agentes.

Aquí es donde entran los protocolos. Convierten sistemas multiagente dispares en un ecosistema interconectado donde los agentes con IA comparten una forma de descubrir, comprender y colaborar entre sí.

Aunque los protocolos agénticos forman parte de la orquestación de agentes de IA, no actúan como orquestadores. Estandarizan la comunicación, pero no gestionan la coordinación, la ejecución y la optimización del flujo de trabajo agéntico.

Beneficios de los protocolos de agentes de IA

Los protocolos de agentes de IA ofrecen estas ventajas:

  • Interoperabilidad

  • Reducción de la complejidad del desarrollo de agentes

  • Estandarización e integración más fluida

Interoperabilidad

Los protocolos de los agentes rompen los silos, lo que permite que la IA agéntica se comunique entre sí independientemente de su propia implementación subyacente. Facilitan la colaboración fluida de los agentes en diferentes dispositivos, entornos y plataformas.

Reducción de la complejidad del desarrollo de agentes

Dado que los protocolos abordan las complejidades de la interacción agéntica y abstraen las complejidades mediante kits de desarrollo de software (SDK), ayudan a agilizar el proceso de creación de sistemas multiagente. Los desarrolladores de IA pueden centrarse más en crear nuevas funcionalidades de agentes y mejorar las existentes.

Estandarización e integración más fluida

Los protocolos de agentes de IA ofrecen un medio de comunicación establecido y estructurado. Y dado que muchos de estos protocolos estandarizados se basan en tecnologías establecidas, ayudan a garantizar la compatibilidad con las pilas tecnológicas actuales, lo que facilita la integración.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Ejemplos de protocolos de agentes de IA

Muchos protocolos aún se encuentran en sus primeras etapas, por lo que aún no se han utilizado o aplicado a gran escala. Esta falta de madurez significa que las organizaciones deben estar preparadas para actuar como pioneros, adaptándose a los cambios de última hora y a las especificaciones en evolución.

A medida que evoluciona la tecnología agéntica, pueden surgir nuevos protocolos. Estos son algunos protocolos actuales de agentes de IA:

  • Protocolo Agent2Agent (A2A)

  • Protocolo de comunicación de agentes (ACP)

  • Protocolo de red de agentes (ANP)

  • Protocolo de interacción agente-usuario (AG-UI)

  • Agora

  • Protocolo LMOS

  • Protocolo de contexto del modelo (MCP) 

Un diagrama de flujo que ilustra la interacción entre un usuario, la IU de la aplicación o el sistema y el sistema multiagente.

Protocolo Agent2Agent (A2A)

El protocolo A2A es un estándar abierto para la comunicación de agentes de IA lanzado inicialmente por Google y ahora gestionado bajo la Linux Foundation. Sigue una configuración de modelo cliente-servidor con un flujo de trabajo de tres pasos:

  1. El descubrimiento se produce cuando una entidad (un usuario humano u otro agente de IA) inicia una solicitud de tarea a un agente cliente, que luego busca agentes remotos para determinar la mejor opción.
  2. Una vez que el agente del cliente identifica un agente remoto capaz de realizar la tarea, pasa por la autenticación. El agente remoto es responsable de la autorización y concesión de permisos de control de acceso.
  3. La comunicación se produce cuando el agente cliente envía la tarea y el agente remoto la procesa. La comunicación entre agentes se realiza a través de HTTPS para un transporte seguro, con JSON-RPC (Remote Procedure Call) 2.0 como formato para el intercambio de datos.

Protocolo de comunicación de agentes (ACP)

Al igual que A2A, el protocolo de comunicación de agentes (ACP) es otro estándar abierto para la comunicación de agente a agente, introducido inicialmente por BeeAI de IBM y ahora parte de la Linux Foundation.

Sus componentes principales incluyen un cliente ACP y un servidor ACP. El cliente ACP envía solicitudes al servidor ACP a través de una API RESTful a través de HTTP. El servidor ACP aloja uno o más agentes detrás de un endpoint único y enruta las tareas al agente adecuado.

Estas son otras características clave de ACP:

  • El protocolo se puede utilizar con herramientas HTTP estándar como Postman o incluso un navegador, pero también hay SDK disponibles.

  • El descubrimiento puede realizarse en línea consultando directamente los servidores ACP y los archivos de manifiesto públicos en URL conocidas. El descubrimiento sin conexión se produce a través de un registro centralizado o mediante el embedding de metadatos de agentes directamente en sus paquetes de distribución.

  • ACP acepta diferentes tipos de mensajes, como audio, imágenes, texto, vídeo o formatos binarios personalizados.

Protocolo de red de agentes (ANP)

El protocolo de red de agentes (ANP) es un protocolo de código abierto cuyo objetivo es ser "el HTTP de la era de la web agéntica". Como tal, emplea HTTP para el transporte de datos y JSON-LD (JSON for Linked Data) para el formato de datos.

ANP adopta una arquitectura peer-to-peer compuesta por tres capas:

  • La capa de identidad implementa tanto el cifrado de principio a fin para una comunicación segura como la autenticación de identidad descentralizada basada en el estándar W3C DID (identificadores descentralizados).

  • La capa de metaprotocolo permite a los agentes negociar y acordar cómo comunicarse.

  • La capa de protocolo de aplicación permite a los agentes autónomos describir sus capacidades y proporciona soporte para el descubrimiento de agentes.

Protocolo de interacción agente-usuario (AG-UI)

El protocolo de interacción agente-usuario (AG-UI) pretende estandarizar la forma en que los agentes de IA de back-end se conectan a las aplicaciones front-end u orientadas al usuario. Está diseñado para la interacción entre humanos y agentes en tiempo real, como chatear con asistentes de IA y chatbots, actualizaciones de estado de transmisión en tiempo real y otras automatizaciones agénticas que implican un enfoque con participación humana.

La arquitectura basada en eventos de AG-UI permite a los agentes de IA producir eventos basados en ciertos activadores del sistema o entradas de los usuarios. El protocolo define un número de categorías de eventos, incluidas las de envío y recepción de mensajes, llamada de herramientas y realización de tareas.

Su capa de middleware admite varios métodos de transporte, como eventos enviados por el servidor (SSE), webhooks y WebSockets. AG-UI también permite que un proxy seguro enrute las solicitudes de forma segura entre los agentes y las interfaces de usuario.

Agora

Agora es un protocolo de comunicación para agentes impulsado por modelos de lenguaje de gran tamaño (LLM). Se basa en algunas capacidades básicas del agente LLM: comprensión del lenguaje natural, seguimiento de instrucciones, escritura y ejecución de código y negociación autónoma.

Los agentes LLM pueden implementar y dar soporte a sus propios protocolos, que describen en texto sin formato dentro de un documento de protocolo. La primera parte del documento contiene metadatos que identifican el nombre del protocolo, la descripción y si se trata de una o varias rondas de conversación. La segunda parte describe cómo se lleva a cabo la comunicación, con instrucciones en una mezcla de lenguaje natural y código. A continuación, se deja que los agentes negocien de forma autónoma qué protocolo adoptar.

Agora emplea HTTPS para transmitir datos y JSON para formatear. También utiliza un sistema de identificación basado en hash para documentos de protocolo.

Protocolo LMOS

Desarrollado por la Eclipse Foundation, el protocolo Language Model Operating System (LMOS) tiene como objetivo marcar el comienzo de una internet de agentes (IoA), un ecosistema multiagente a escala de internet. Al igual que ANP, su arquitectura estructurada consta de tres capas:

  • La capa de identidad y seguridad proporciona comunicación cifrada y admite diferentes esquemas de autenticación, como W3C DID y OAuth 2.0.

  • La capa de protocolo de transporte permite a los agentes elegir y adaptar el protocolo de transporte que se adapte a su propósito para cada interacción.

  • La capa de protocolo de aplicación describe formatos para descripciones de agentes y herramientas, métodos de descubrimiento, un modelo de datos semántico y un subprotocolo websocket.

El protocolo LMOS utiliza JSON-LD para describir las capacidades de herramientas y agentes y otros metadatos. El descubrimiento se produce de forma dinámica, consultando un directorio central o a través de redes descentralizadas.

Protocolo de contexto del modelo (MCP)

Introducido por Anthropic, el protocolo del contexto del modelo (MCP) proporciona una forma estandarizada para que los modelos de IA obtengan el contexto que necesitan para llevar a cabo las tareas. En el ámbito agéntico, MCP actúa como un nivel para que los agentes de IA se conecten y se comuniquen con servicios y herramientas externos, como API, bases de datos, archivos, búsquedas web y otras fuentes de datos.

MCP abarca estos tres elementos arquitectónicos clave:

  • El host MCP contiene lógica de orquestación y puede conectar cada cliente MCP a un servidor MCP. Puede alojar varios clientes.

  • Un cliente MCP convierte las solicitudes de los usuarios en un formato estructurado que el protocolo puede procesar. Cada cliente tiene una relación uno a uno con un servidor MCP. Los clientes gestionan sesiones, analizan y verifican respuestas y gestionan errores.

  • El servidor MCP convierte las solicitudes de los usuarios en acciones del servidor. Los servidores suelen ser repositorios de GitHub disponibles en varios lenguajes de programación y proporcionan acceso a herramientas. También se pueden utilizar para conectar la inferencia LLM al SDK de MCP a través de proveedores de plataformas de IA como IBM y OpenAI.

En la capa de transporte entre clientes y servidores, los mensajes se transmiten en formato JSON-RPC 2.0 utilizando la entrada/resultado estándar (stdio) para la mensajería ligera y síncrona o SSE para las llamadas asíncronas y basadas en eventos.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones del mundo real

Descubra cómo la IA basada en objetivos y servicios se adapta a flujos de trabajo y entornos complejos.

Factores a tener en cuenta al elegir un protocolo de agente de IA

Ante la falta de puntos de referencia para la evaluación estandarizada, las empresas deben realizar su propia evaluación del protocolo que mejor se adapte a sus necesidades empresariales. Es posible que deban comenzar con un caso de uso pequeño y controlado combinado con pruebas exhaustivas y rigurosas.

Estos son algunos aspectos a tener en cuenta al evaluar los protocolos de los agentes:

  • Eficiencia

  • Fiabilidad

  • Escalabilidad

  • Seguridad

Eficiencia

Lo ideal es que los protocolos estén diseñados para limitar la latencia, lo que se traduce en una transferencia de datos ágil y tiempos de respuesta rápidos. Aunque se espera cierta sobrecarga de comunicación, debe mantenerse al mínimo.

Fiabilidad

Los protocolos de los agentes de IA deben ser capaces de gestionar las condiciones cambiantes de la red a lo largo de los flujos de trabajo de los agentes, con mecanismos establecidos para gestionar los fallos o las interrupciones. Por ejemplo, ACP está diseñado con comunicación asíncrona por defecto, lo que se adapta a tareas complejas o de larga duración. Por su parte, A2A admite la transmisión en tiempo real mediante SSE para resultados grandes o largos o actualizaciones de estado continuas.

Escalabilidad

Los protocolos deben ser lo suficientemente robustos como para atender a los ecosistemas de agentes en crecimiento sin que su rendimiento disminuya. La evaluación de la escalabilidad puede incluir aumentar el número de agentes o enlaces a herramientas externas durante un periodo de tiempo, ya sea de forma gradual o repentina, para observar cómo funciona un protocolo en esas condiciones.

Seguridad

Mantener la seguridad es primordial, y los protocolos de los agentes incorporan cada vez más barreras de seguridad. Estos incluyen autenticación, cifrado y control de acceso.

Soluciones relacionadas
Agentes de IA para empresas

Cree, implemente y gestione potentes asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

    Explore watsonx Orchestrate
    Soluciones de agente de IA de IBM

    Construya el futuro de su empresa con soluciones de IA en las que puede confiar.

    Explore las soluciones de los agentes de IA
    Servicios de IA de IBM Consulting

    Los servicios de IA de IBM Consulting ayudan a reinventar la forma de trabajar de las empresas usando IA para la transformación.

    Explore los servicios de inteligencia artificial
    Dé el siguiente paso

    Tanto si opta por personalizar las aplicaciones y habilidades prediseñadas como si prefiere crear e implementar servicios agentivos personalizados mediante un estudio de IA, la plataforma IBM watsonx le ofrece todo lo que necesita.

    Explore watsonx Orchestrate Explore watsonx.ai