¿Qué es la arquitectura agéntica?

Autores

Vanna Winland

AI Advocate & Technology Writer

Jess Bozorg

Lead, AI Advocacy

IBM

Cole Stryker

Staff Editor, AI Models

IBM Think

¿Qué es la arquitectura agéntica?

La arquitectura agéntica se refiere a la estructura y el diseño de marcos de inteligencia artificial (IA) agéntica. Una arquitectura agéntica es aquella que da forma al espacio virtual y a la estructura del flujo de trabajo para automatizar los modelos de IA dentro de un sistema de IA agéntica.

La IA agéntica es un sistema o programa que utiliza agentes de IA para realizar tareas de forma autónoma en nombre de un usuario u otro sistema. La arquitectura agéntica funciona para respaldar y regular el comportamiento de los agentes con IA que trabajan dentro de un sistema de IA generativa (IA gen). Los sistemas de IA agéntica requieren que sus agentes sean adaptables y naveguen por entornos dinámicos para lograr los resultados deseados.

El modelo no es tan diferente de la psicología humana: la agencia se refiere a la capacidad de hacer que algo suceda intencionalmente en función de las acciones de uno1. Para lograr los resultados deseados, hay que utilizar la planificación, la acción, la memoria y la reflexión. Estas características se alinean con las de los agentes de IA modernos que se utilizan tanto en marcos de un solo agente como de múltiples agentes.
 
Los avances en algoritmos de machine learning (ML) y modelos de lenguaje de gran tamaño (LLM) como GPT de OpenAI han impulsado el desarrollo de agentes de IA. El objetivo de la arquitectura agentiva es proporcionar una estructura para que un LLM automatice a los agentes para completar tareas complejas.

El comportamiento autónomo o de toma de decisiones de un agente de IA depende de la infraestructura que lo habilita. La arquitectura agéntica está diseñada para adaptarse a entornos dinámicos, mejorando la interoperabilidad.

Por ejemplo, los agentes pueden interactuar con diversas fuentes y formatos de datos, interfaces de programación de aplicaciones (API) o sistemas. Este comportamiento adaptable permite a los agentes tomar decisiones informadas.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Cómo funciona la arquitectura agéntica

La arquitectura de IA agéntica debe estar compuesta por componentes que aborden los factores centrales de una agencia: intencionalidad (planificación), previsión, autorreactividad y autorreflexión2. Estos factores proporcionan autonomía a los agentes de IA para que puedan establecer objetivos, planificar, monitorizar su rendimiento y reflexionar para alcanzar su objetivo específico.
 
La tecnología agéntica utiliza llamadas a herramientas de backend para recopilar información actualizada, optimiza flujos de trabajo complejos y genera automáticamente tareas para lograr objetivos complejos.

A medida que opera, el agente autónomo se adapta a las preferencias del usuario a lo largo del tiempo, ofreciendo una experiencia más personalizada y entregando respuestas más detalladas. Este proceso de llamada a herramientas puede ejecutarse sin entrada humana, desbloqueando posibilidades más amplias para las aplicaciones de IA del mundo real.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones del mundo real

Descubra cómo la IA basada en objetivos y servicios se adapta a flujos de trabajo y entornos complejos.

Agéntica vs. no agéntica

Las arquitecturas agénticas admiten el comportamiento agéntico en los agentes de IA. Los agentes de IA son sistemas adaptables impulsados por modelos de machine learning que pueden interactuar con entornos externos y utilizar herramientas para completar objetivos específicos. No todos los agentes de IA son agénticos. Depende de la complejidad y las capacidades del marco o sistema de orquestación.

La arquitectura agéntica permite a los agentes de IA actuar con cierto grado de autonomía y tomar decisiones basadas en objetivos sin la necesidad constante de entrada humana3. Los agentes autónomos de IA requieren poca o ninguna intervención humana para completar sus tareas específicas.

En las arquitecturas no agentes, los LLM son capaces de realizar tareas singulares o lineales4. La función de los modelos de IA en una arquitectura no agente es proporcionar resultados basados en la entrada y el contexto.

Sin una orquestación explícita, los LLM no pueden retener nueva información en tiempo real y, a menudo, luchan con problemas complejos debido a su contexto limitado. Por ejemplo, algunas aplicaciones comunes de IA que no requieren flujos de trabajo agénticos complejos incluyen el análisis semántico, los chatbots y la generación de texto.

La arquitectura agéntica ideal depende de los requisitos de la aplicación y el caso de uso. Los sistemas de agente único destacan a la hora de abordar problemas específicos y centrados, actuando esencialmente como solucionadores de problemas individuales.

Sin embargo, algunos desafíos pueden requerir la experiencia única de un agente especializado, mientras que otros pueden beneficiarse de un enfoque colaborativo que involucre a varios agentes trabajando juntos como un equipo.

Tipos de arquitecturas agénticas

La tabla proporciona una comparación clara de los diferentes tipos de sistemas de arquitectura de agentes de IA: vertical, horizontal e híbrido. Destaca sus estructuras, características clave, puntos fuertes, puntos débiles y casos de uso para ayudar a determinar el enfoque más adecuado para diversas tareas. 

Arquitecturas de un solo agente

Una arquitectura de agente único tiene una característica de una única entidad autónoma que toma decisiones centralizadas dentro de un entorno.

  • Estructura

    • Una arquitectura de agente único es un sistema en el que un único agente de IA opera de forma independiente para percibir su entorno, tomar decisiones y emprender acciones para lograr un objetivo.

  • Características clave

    • Autonomía: el agente opera de forma independiente sin necesidad de interactuar con otros agentes.
       
  • Puntos fuertes

    • Simplicidad: más fácil de diseñar, desarrollar e implementar en comparación con los sistemas multiagente. Requiere menos recursos porque no necesita gestionar múltiples agentes o protocolos de comunicación.
    • Previsibilidad: más fácil de depurar y monitorizar porque el agente funciona de forma independiente.
    • Velocidad: sin necesidad de negociación ni de creación de consenso entre varios agentes.
    • Coste: menos costoso de mantener y actualizar en comparación con las complejas arquitecturas multiagente. Menos desafíos de integración cuando se implementa en aplicaciones empresariales.
       
  • Puntos débiles

    • Escalabilidad limitada: un solo agente puede convertirse en un cuello de botella cuando se manejan tareas complejas o de gran volumen.
    • Rigidez: le cuesta las tareas que requieren flujos de trabajo de varios pasos o coordinación en diferentes dominios.
    • Estrecho: normalmente diseñado para una función o dominio específico.
       
  • Mejores casos de uso

    • Chatbots simples: los chatbots pueden funcionar de forma independiente, no requieren coordinación con otros agentes y funcionan bien en interacciones de usuario autónomas y estructuradas.
    • Sistemas de recomendación: las recomendaciones de contenido personalizadas, como las que se experimentan en los servicios de transmisión, son lo suficientemente sencillas para una arquitectura de agente único.

Arquitecturas multiagente

Las arquitecturas multiagente van más allá de las capacidades de IA de las configuraciones tradicionales de un solo agente, aportando varios beneficios únicos. Cada agente se especializa en un dominio específico, como el rendimiento, la prevención de lesiones o la investigación de mercado, mientras colabora de manera fluida para resolver problemas complejos.

Los agentes adaptan sus funciones en función de la evolución de las tareas, lo que ayuda a garantizar la flexibilidad y la capacidad de respuesta en escenarios dinámicos.

Los sistemas multiagente son más flexibles. Un agente podría utilizar el procesamiento del lenguaje natural (PLN), otro podría especializarse en la visión artificial. Un agente podría utilizar generación aumentada por recuperación (RAG) para extraer de conjuntos de datos.

Hay muchos proveedores de marcos multiagente, como crewAI, un marco multiagente basado en Python que funciona sobre LangChain. Otra solución de IA es DeepWisdom, que ofrece MetaGPT, un marco que utiliza un flujo de trabajo estructurado guiado por procedimientos operativos estándar.

Arquitecturas verticales de IA

  • Estructura

    • En una arquitectura vertical, un agente líder supervisa las subtareas y las decisiones, y los agentes informan para un control centralizado5. Los agentes de IA conocen su función e informan o supervisan a otros agentes en consecuencia.
       
  • Características clave

    • Jerarquía: los roles están claramente definidos.
    • Comunicación centralizada: los agentes informan al líder.
       
  • Puntos fuertes

    • Eficiencia de las tareas: ideal para flujos de trabajo secuenciales.
    • Responsabilidad clara: el líder alinea el objetivo.
  • Puntos débiles

    • Cuellos de botella: la dependencia del líder puede ralentizar el progreso.

    • Punto único de fallo: vulnerable a problemas de líder.

  • Mejores casos de uso

    • Automatización del flujo de trabajo: aprobaciones en varios pasos.

    • Generación de documentos: secciones supervisadas por un líder.

Arquitecturas horizontales de IA

  • Estructura

    • Modelo de colaboración entre iguales: los agentes trabajan como iguales en un sistema descentralizado, colaborando libremente para resolver tareas6.

  • Características clave

    • Colaboración distribuida: todos los agentes comparten recursos e ideas.

    • Decisiones descentralizadas: toma de decisiones impulsada por el grupo para la autonomía colaborativa.

  • Puntos fuertes

    • Resolución dinámica de problemas: fomenta la innovación.

    • Procesamiento paralelo: los agentes trabajan en tareas simultáneamente.

  • Puntos débiles

    • Desafíos de coordinación: la mala gestión puede causar ineficiencias.

    • Decisiones más lentas: demasiada deliberación.

  • Mejores casos de uso

    • Lluvia de ideas: generación de ideas diversas.

    • Resolución de problemas complejos: abordar desafíos interdisciplinarios.

Arquitecturas de IA híbridas

  • Estructura

    • Combina el liderazgo estructurado con la flexibilidad colaborativa; cambios de liderazgo basados en los requisitos de la tarea.

  • Características clave

    • Liderazgo dinámico: el liderazgo se adapta a la fase de la tarea.

    • Liderazgo colaborativo: los líderes involucran a sus compañeros abiertamente.

  • Puntos fuertes

    • Versatilidad: combina los puntos fuertes de ambos modelos.

    • Adaptabilidad: gestiona tareas que requieren tanto estructura como creatividad.

  • Puntos débiles

    • Complejidad: equilibrar las funciones de liderazgo y la colaboración requiere mecanismos sólidos.

    • Gestión de recursos: más exigente.

  • Mejores casos de uso

    • Tareas versátiles: planificación estratégica o proyectos en equipo.

    • Procesos dinámicos: equilibrar las demandas estructuradas y creativas.

Diagrama de arquitecturas de agente único y multiagente

Marcos agénticos

Los marcos agénticos se refieren a arquitecturas de diseño o modelos que definen cómo los agentes (ya sean artificiales o naturales) pueden realizar tareas, tomar decisiones e interactuar con su entorno de forma autónoma e inteligente. Estos marcos proporcionan la estructura y las directrices sobre cómo operan, razonan y se adaptan los agentes en diversos entornos.

Arquitecturas reactivas

Las arquitecturas reactivas asignan situaciones directamente a acciones. Son reflexivos, toman decisiones basadas en estímulos inmediatos del entorno en lugar de basarse en la memoria o las capacidades predictivas. No pueden aprender del pasado ni planificar el futuro. 

Arquitecturas deliberativas

Una arquitectura deliberativa es un sistema de IA que toma decisiones basadas en el razonamiento, la planificación y los modelos internos del mundo. A diferencia de los agentes reactivos, los agentes deliberativos analizan su entorno, predicen resultados futuros y toman decisiones informadas antes de actuar.

Arquitecturas cognitivas

Una arquitectura agéntica cognitiva es un sistema avanzado de IA que imita el pensamiento, el razonamiento, el aprendizaje y la toma de decisiones similares a los humanos.

Estos agentes incorporan elementos de percepción, memoria, razonamiento y adaptación, cada uno representado por módulos individuales, lo que les permite operar en entornos complejos e inciertos mientras mejoran con el tiempo. Este es el tipo más avanzado de arquitectura agéntica.

Una arquitectura BDI (más comúnmente conocida como modelo o marco) está diseñada para modelar la toma de decisiones racional en agentes inteligentes, y se basa en el marco creencia-deseo-intención (BDI).

Esta arquitectura modela el razonamiento humano en un agente BDI, con:

  • Creencias (B): el conocimiento del agente del mundo, que podría incluir su comprensión del entorno, la situación actual y cualquier dato sensorial.

Ejemplo: "La puerta está cerrada".

  • Deseos (D): las metas u objetivos del agente, que representan lo que quiere lograr. Los deseos no son necesariamente acciones, sino objetivos de alto nivel.

Ejemplo: "Quiero entrar en la habitación".

  • Intenciones (I): el curso de acción al que se compromete el agente para lograr sus deseos. Las intenciones representan acciones planificadas que el agente persigue activamente, teniendo en cuenta sus creencias y deseos.

Ejemplo: "Abriré la puerta para entrar en la habitación".

Notas a pie de página

1 Bandura A. “Social cognitive theory: an agentic perspective”. Annu Rev Psychol. 2001;52:1-26. doi: 10.1146/annurev.psych.52.1.1. https://pubmed.ncbi.nlm.nih.gov/11148297/.

2 Bandura A. “Social cognitive theory: an agentic perspective”.

3 T. Masterman, S. Besen, M. Sawtell, y A. Chao, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey". Preimpresión de arXiv. 2404.11584, Apr. 2024. [En línea]. Disponible: https://arxiv.org/abs/2404.11584.

4 E. H. Durfee y V. Lesser, "Negotiating Task Decomposition and Allocation Using Partial Global Planning", en Distributed Artificial Intelligence Volume II. Ed. L. Gasser y M. Huhns (Londres: Pitman Publishing; San Mateo, CA: Morgan Kaufmann, 1989). 229–244.

5 Masterman, et al. "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey".

6 Masterman, et al. "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey".

Soluciones relacionadas
Desarrollo de agentes de IA de IBM 

Permita a los desarrolladores crear, implementar y monitorizar agentes de IA con el estudio IBM watsonx.ai.

Explore watsonx.ai
Agentes y asistentes de IA de IBM

Cree una productividad sin precedentes con uno de los conjuntos de capacidades más completos del sector para ayudar a las empresas a crear, personalizar y gestionar agentes y asistentes de IA. 

Explore los agentes de IA
IBM Granite

Ahorre más de un 90 % en costes con los modelos más pequeños y abiertos de Granite, diseñados para la eficiencia de los desarrolladores. Estos modelos listos para uso empresarial ofrecen un rendimiento excepcional frente a los puntos de referencia de seguridad y en una amplia gama de tareas empresariales, desde la ciberseguridad hasta RAG.

Explore Granite
Dé el siguiente paso

Automatice sus flujos de trabajo complejos y cree una productividad revolucionaria con uno de los conjuntos de capacidades más completos del sector para ayudar a las empresas a crear, personalizar y gestionar agentes de IA y asistentes. 

Explore el desarrollo de agentes de watsonx.ai Descubra watsonx Orchestrate