Las últimas tendencias de IA presentadas por expertos
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Los protocolos de agentes de IA establecen estándares de comunicación entre agentes de inteligencia artificial y entre agentes de IA y otros sistemas. Estos protocolos especifican la sintaxis, la estructura y la secuencia de los mensajes, junto con las convenciones de comunicación, como los roles que asumen los agentes en las conversaciones y cuándo y cómo responden a los mensajes.
Los sistemas de IA basados en agentes a menudo se ejecutan en silos. Están creados por diferentes proveedores que utilizan diversas infraestructuras de agentes de IA y emplean arquitecturas de agentes distintas. La integración en el mundo real se convierte en un desafío, y acoplar estos sistemas fragmentados requiere conectores personalizados para todos los tipos posibles de interacción entre agentes.
Aquí es donde entran los protocolos. Convierten sistemas de múltiples agentes dispares en un ecosistema interconectado donde los agentes impulsados por IA comparten una forma de descubrir, comprender y colaborar entre sí.
Si bien los protocolos agénticos forman parte de la orquestación de agentes de IA, no actúan como orquestadores. Estandarizan la comunicación, pero no gestionan la coordinación, ejecución y optimización del flujo de trabajo agéntico.
Los protocolos de agente de IA ofrecen estas ventajas:
Reducción de la complejidad del desarrollo de agentes
Estandarización e integración más fluida
Los protocolos de agente rompen los silos, lo que permite que la IA agéntica se comunique entre sí independientemente de su propia implementación subyacente. Facilitan la colaboración fluida de los agentes en diferentes dispositivos, entornos y plataformas.
Debido a que los protocolos abordan las complejidades de la interacción agentiva y abstraen las complejidades a través de kits de desarrollo de software (SDK), ayudan a agilizar el proceso de creación de sistemas multiagente. Los desarrolladores de IA pueden centrarse más en crear nuevas funcionalidades de agentes y mejorar las existentes.
Los protocolos de agentes de IA ofrecen un medio de comunicación establecido y estructurado. Y dado que muchos de estos protocolos estandarizados se basan en tecnologías establecidas, ayudan a garantizar la compatibilidad con las pilas de tecnología actuales, lo que facilita la integración empresarial.
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Muchos protocolos aún se encuentran en sus primeras etapas, por lo que aún no se han utilizado o aplicado ampliamente a gran escala. Esta falta de madurez significa que las organizaciones deben estar preparadas para actuar como primeros usuarios, ajustándose a los cambios de última hora y a las especificaciones en evolución.
A medida que la tecnología agentiva evoluciona, pueden surgir nuevos protocolos. Estos son algunos protocolos actuales de agentes de IA:
Protocolo Agent2Agent (A2A)
Protocolo de comunicación de agentes (ACP)
Protocolo de red de agentes (ANP)
Protocolo de interacción agente-usuario (AG-UI)
Agora
Protocolo LMOS
Protocolo de contexto del modelo (MCP)
El protocolo A2A es un estándar abierto para la comunicación de agentes de IA lanzado inicialmente por Google y ahora gestionado bajo la Fundación Linux. Sigue una configuración de modelo cliente-servidor con un flujo de trabajo de tres pasos:
Al igual que A2A, el protocolo de comunicación de agentes (ACP) es otro estándar abierto para la comunicación de agente a agente, introducido inicialmente por BeeAI de IBM y ahora parte de la Fundación Linux.
Sus componentes principales incluyen un cliente ACP y un servidor ACP. El cliente ACP envía solicitudes al servidor ACP a través de una API RESTful a través de HTTP. El servidor ACP aloja uno o más agentes detrás de un único endpoint HTTP y enruta las tareas al agente adecuado.
Estas son otras características clave de ACP:
El protocolo se puede utilizar con herramientas HTTP estándar como Postman o incluso un navegador, pero también hay SDK disponibles.
El descubrimiento puede ocurrir en línea consultando los servidores ACP directamente y los archivos de manifiesto públicos en URL conocidas. El descubrimiento sin conexión se produce a través de un registro centralizado o mediante la incorporación de metadatos de agentes directamente en sus paquetes de distribución.
ACP acepta diferentes tipos de mensajes, como audio, imágenes, texto, video o formatos binarios personalizados.
El Agent Network Protocol (ANP) es un protocolo de código abierto cuyo objetivo es ser "el HTTP de la era de la web agentiva". Como tal, emplea HTTP para el transporte de datos y JSON-LD (JSON para datos vinculados) para el formateo de datos.
ANP adopta una arquitectura peer-to-peer compuesta por tres capas:
La capa de identidad implementa tanto el cifrado de extremo a extremo para la comunicación segura como la autenticación de identidad descentralizada basada en el estándar W3C DID (Identificadores Descentralizados).
La capa de metaprotocolo permite a los agentes negociar y acordar cómo comunicarse.
La capa de protocolo de aplicación permite a los agentes autónomos describir sus capacidades y proporciona soporte para el descubrimiento de agentes.
El protocolo de interacción agente-usuario (AG-UI) pretende estandarizar la forma en que los agentes de IA de back-end se conectan a las aplicaciones de front-end o orientadas al usuario. Está diseñado para la interacción humano-agente en tiempo real, como chatear con asistentes de IA y chatbots, actualizaciones de estado de transmisión en vivo y otras automatizaciones agénticas que conllevan un enfoque de intermediario.
La arquitectura basada en eventos de AG-interfaz de usuario (IU) permite a los agentes de IA producir eventos basados en ciertos activadores del sistema o entradas de los usuarios. El protocolo define un número de categories de eventos, incluidas aquellas para enviar y recibir mensajes, llamar a herramientas y realizar tareas.
Su capa de middleware admite varios métodos de transporte, como eventos enviados por el servidor (SSE), webhooks y WebSockets. AG-UI también permite que un proxy seguro enrute las solicitudes de forma segura entre los agentes y las interfaces de usuario.
Agora es un protocolo de comunicación para agentes impulsado por modelos de lenguaje de gran tamaño (LLM). Se basa en algunas capacidades del agente LLM: natural language understanding, seguimiento de instrucciones, escritura y ejecución de código y negociación autónoma.
Los agentes de LLM pueden implementar y admitir sus propios protocolos, que describen en texto sin formato dentro de un documento de protocolo. La primera parte del documento contiene metadatos que identifican el nombre del protocolo, la descripción y si es para una o varias rondas de conversación. La segunda parte describe cómo se lleva a cabo la comunicación, con instrucciones en una combinación de lenguaje natural y código. Luego, se deja que los agentes negocien de forma autónoma qué protocolo adoptar.
Agora emplea HTTPS para transmitir datos y JSON para formatear. También utiliza un sistema de identificación basado en hash para documentos de protocolo.
Desarrollado por Eclipse Foundation, el protocolo Language Model Operating System (LMOS) tiene como objetivo marcar el comienzo de un Internet de agentes (IoA), un ecosistema de múltiples agentes a escala de Internet. Al igual que ANP, su arquitectura estructurada consta de tres capas:
La capa de identidad y seguridad proporciona comunicación cifrada y admite diferentes esquemas de autenticación, como W3C DID y OAuth 2.0.
La capa de protocolo de transporte permite a los agentes elegir y adaptar el protocolo de transporte que se adapte a su propósito para cada interacción.
La capa de protocolo de aplicación describe formatos para descripciones de agentes y herramientas, métodos de descubrimiento, un modelo de datos semántico y un subprotocolo websocket.
El protocolo LMOS utiliza JSON-LD para describir las capacidades de herramientas y agentes y otros metadatos. El descubrimiento ocurre de forma dinámica, consultando un directorio central o a través de redes descentralizadas.
Presentado por Anthropic, el Model Context Protocol (MCP) proporciona una forma estandarizada para que los modelos de IA obtengan el contexto que necesitan para llevar a cabo las tareas. En el ámbito de los agentes, MCP actúa como un nivel para que los agentes de IA se conecten y se comuniquen con servicios y herramientas externos, como API, bases de datos, archivos, búsquedas web y otras fuentes de datos.
MCP abarca estos tres elementos arquitectónicos clave:
El host MCP contiene lógica de orquestación y puede conectar cada cliente MCP a un servidor MCP. Puede alojar varios clientes.
Un cliente MCP convierte las solicitudes de los usuarios en un formato estructurado que el protocolo puede procesar. Cada cliente tiene una relación uno a uno con un servidor MCP. Los clientes gestionan sesiones, analizan y verifican respuestas y manejan errores.
El servidor MCP convierte las solicitudes de los usuarios en acciones del servidor. Los servidores suelen ser repositorios de GitHub disponibles en varios lenguajes de programación y proporcionan acceso a herramientas. También se pueden utilizar para conectar la inferencia LLM al SDK de MCP a través de proveedores de plataformas de IA, como IBM y OpenAI.
En la capa de transporte entre clientes y servidores, los mensajes se transmiten en formato JSON-RPC 2.0 utilizando entrada/salida estándar (stdio) para mensajería ligera y sincrónica o SSE para llamadas asincrónicas basadas en eventos.
Con la falta de puntos de referencia para la evaluación estandarizada, las empresas deben realizar su propia evaluación del protocolo que mejor se adapte a sus necesidades comerciales. Es posible que deban comenzar con un caso de uso pequeño y controlado combinado con pruebas exhaustivas y rigurosas.
Estos son algunos aspectos a tener en cuenta al evaluar los protocolos de los agentes:
Eficiencia
Confiabilidad
Escalabilidad
Seguridad
Idealmente, los protocolos están diseñados para limitar la latencia, lo que resulta en una transferencia de datos rápida y tiempos de respuesta rápidos. Si bien se espera cierta sobrecarga de comunicación, debe mantenerse al mínimo.
Los protocolos de agentes de IA deben ser capaces de manejar las condiciones cambiantes de la red a través de flujos de trabajo de agentes, con mecanismos implementados para gestionar fallas o interrupciones. Por ejemplo, ACP está diseñado con comunicación asíncrona por defecto, lo que se adapta a tareas complejas o de larga duración. Mientras tanto, A2A admite la transmisión en tiempo real mediante SSE para salidas grandes o largas o actualizaciones de estado continuas.
Los protocolos deben ser lo suficientemente sólidos como para atender a los ecosistemas de agentes en crecimiento sin que disminuya su rendimiento. La evaluación de la escalabilidad puede incluir aumentar la cantidad de agentes o enlaces a herramientas externas durante un período de tiempo, ya sea de forma gradual o repentina, para observar cómo funciona un protocolo en esas condiciones.
Mantener la seguridad es primordial, y los protocolos de los agentes incorporan cada vez más medidas de seguridad. Estos incluyen autenticación, cifrado y control de acceso.
Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.
Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.
Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.