¿Qué es la arquitectura agéntica?

Autores

Vanna Winland

AI Advocate & Technology Writer

Jess Bozorg

Lead, AI Advocacy

IBM

Cole Stryker

Staff Editor, AI Models

IBM Think

¿Qué es la arquitectura agéntica?

La arquitectura agéntica se refiere a la estructura y el diseño de marcos de inteligencia artificial (IA) agénticos. Una arquitectura agéntica es aquella que da forma al espacio virtual y a la estructura del flujo de trabajo para automatizar los modelos de IA dentro de un sistema de IA agéntica.

La IA agéntica es un sistema o programa que utiliza agentes de IA para realizar tareas de forma autónoma en nombre de un usuario u otro sistema. La arquitectura agéntica funciona para respaldar y regular el comportamiento de los agentes impulsados por IA que trabajan dentro de un sistema de IA generativa.

Los sistemas de IA agéntica requieren que sus agentes sean adaptables y naveguen por entornos dinámicos para lograr los resultados deseados. El modelo no es tan diferente de la psicología humana: la agencia se refiere a la capacidad de hacer que algo suceda intencionalmente en función de las acciones que una persona realice.1 Para lograr los resultados deseados, se debe utilizar la planificación, la acción, la memoria y la reflexión. Estas características se alinean con las de los agentes de IA modernos que se utilizan en los marcos tanto de un solo agente como de múltiples.
 
Los avances en los algoritmos de machine learning (ML) y los modelos de lenguaje de gran tamaño (LLM) como GPT de OpenAI han impulsado el desarrollo de agentes de IA. El objetivo de la arquitectura agéntica es proporcionar una estructura para que un LLM automatice a los agentes para completar tareas complejas.

El comportamiento autónomo o de toma de decisiones de un agente de IA depende de la infraestructura que lo habilita. La arquitectura agéntica está diseñada para adaptarse a entornos dinámicos, mejorando la interoperabilidad.

Por ejemplo, los agentes pueden interactuar con diversas fuentes y formatos de datos, interfaces de programación de aplicaciones (API) o sistemas. Este comportamiento adaptable permite a los agentes tomar decisiones informadas.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Cómo funciona la arquitectura agéntica

La arquitectura de IA agéntica debe estar compuesta por componentes que aborden los factores centrales de una agencia: intencionalidad (planificación), previsión, autorreactividad y autorreflexión.2 Estos factores proporcionan autonomía a los agentes de IA para que puedan establecer objetivos, planificar, monitorear su desempeño y reflexionar para alcanzar su objetivo específico.
 
La tecnología agéntica utiliza llamadas a herramientas de backend para recopilar información actualizada, realiza la optimización de flujos de trabajo complejos y genera automáticamente tareas para lograr objetivos complejos.

A medida que opera, el agente autónomo se adapta a las preferencias del usuario a lo largo del tiempo, ofreciendo una experiencia más personalizada y brindando respuestas más detalladas. Este proceso de llamada a herramientas puede ejecutarse sin entradas humanas, desbloqueando posibilidades más amplias para aplicaciones de IA del mundo real.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones reales

Descubra cómo la IA orientada a objetivos y basada en utilidades se adapta a los flujos de trabajo y entornos complejos.

Agéntica vs. no agéntica

Las arquitecturas agénticas admiten el comportamiento de los agentes dentro de los agentes de IA. Los agentes de IA son sistemas adaptables impulsados por modelos de machine learning que pueden interactuar con entornos externos y utilizar herramientas para completar objetivos específicos. No todos los agentes de IA son agénticos. Depende de la complejidad y las capacidades de la infraestructura o sistema de orquestación.

La arquitectura agéntica permite a los agentes de IA actuar con cierto grado de autonomía y tomar decisiones basadas en objetivos sin la necesidad constante de entradas humanas.3 Los agentes autónomos de IA requieren poca o ninguna intervención humana para completar sus tareas específicas.

En las arquitecturas no agénticas, los LLM son capaces de realizar tareas únicas o lineales.4 La función del modelo de IA en una arquitectura no agente es proporcionar resultados basados en la entrada y el contexto.

Sin una orquestación explícita, los LLM no pueden retener nueva información en tiempo real y, a menudo, tienen problemas complejos debido a su contexto limitado. Por ejemplo, algunas aplicaciones comunes de IA que no requieren flujos de trabajo de agentes complejos incluyen análisis semántico, chatbots y generación de texto.

La arquitectura de agente ideal depende de los requisitos de la aplicación y el caso de uso. Los sistemas de agente único se destacan por direcionar problemas específicos y enfocados, actuando esencialmente como solucionadores de problemas individuales.

Sin embargo, algunos desafíos pueden requerir la experiencia única de un agente especializado, mientras que otros pueden tener un beneficio de un enfoque colaborativo que involucre a varios agentes que trabajan juntos como un equipo.

Tipos de arquitecturas agénticas

La tabla proporciona una comparación clara de los diferentes tipos de sistemas de arquitectura de agentes de IA: vertical, horizontal e híbrido. Destaca sus estructuras, características clave, fortalezas, debilidades y casos de uso para ayudar a determinar el enfoque más adecuado para diversas tareas. 

Arquitecturas de agente único

Una arquitectura de agente único tiene una única entidad autónoma que toma decisiones centralizadas dentro de un entorno.

  • Estructura

    • Una arquitectura de agente único es un sistema en el que un único agente de IA opera de forma independiente para percibir su entorno, tomar decisiones y tomar medidas para lograr un objetivo.

  • Características clave

    • Autonomía: el agente opera de forma independiente sin requerir interacción con otros agentes.
       
  • Fortalezas

    • Simplicidad: más fácil de diseñar, desarrollar y desplegar que los sistemas multiagente. Requiere menos recursos porque no necesita gestionar múltiples agentes o protocolos de comunicación.
    • Previsibilidad: más fácil de depurar y monitorear porque el agente opera de forma independiente.
    • Velocidad: no es necesario negociar ni crear consenso entre múltiples agentes.
    • Costo: menos costoso de mantener y actualizar que las arquitecturas complejas de múltiples agentes. Menos desafíos de integración cuando se despliega en aplicaciones empresariales.
       
  • Debilidades

    • Escalabilidad limitada: un solo agente puede convertirse en un cuello de botella al manejar tareas complejas o de gran volumen.
    • Rigidez: tiene dificultades con tareas que requieren flujos de trabajo de varios pasos o coordinación en diferentes dominios.
    • Estrecho: normalmente está diseñado para una función o dominio específico.
       
  • Mejores casos de uso

    • Chatbots simples: los chatbots pueden operar de forma independiente, no requieren coordinación con otros agentes y funcionan bien en interacciones de usuario autónomas y estructuradas.
    • Sistemas de recomendación: las recomendaciones de contenido personalizadas, como las que se experimentan en los servicios de transmisión, son lo suficientemente sencillas para una arquitectura de agente único.

Arquitecturas multiagente

Las arquitecturasmultiagente van más allá de las capacidades de IA de las configuraciones tradicionales de un solo agente, aportando varios beneficios únicos. Cada agente se especializa en un dominio específico, como análisis de rendimiento, prevención de lesiones o investigación de mercado, mientras colabora perfectamente para resolver problemas complejos.

Los agentes adaptan sus roles en función de las tareas en evolución, lo que ayuda a garantizar la flexibilidad y la capacidad de respuesta en escenarios dinámicos.

Los sistemas multiagente son más flexibles. Un agente podría usar procesamiento de lenguaje natural (PLN), otro podría especializarse en visión artificial. Un agente podría usar generación aumentada por recuperación (RAG) para extraer de conjuntos de datos.

Hay muchos proveedores de marcos multiagente, como CrewAI, un marco multiagente basado en Python que opera sobre LangChain. Otra solución de IA es DeepWisdom, que ofrece MetaGPT, un marco que utiliza un flujo de trabajo estructurado guiado por procedimientos operativos estándar.

Arquitecturas verticales de IA

  • Estructura

    • En una arquitectura vertical, un agente líder supervisa las subtareas y las decisiones, y los agentes informan a un control centralizado.5 Los agentes de IA jerárquica conocen su función e informan o supervisan a otros agentes en consecuencia.
       
  • Características clave

    • Jerarquía: los roles están claramente definidos.
    • Comunicación centralizada: los agentes informan al líder.
       
  • Fortalezas

    • Eficiencia de las tareas: ideal para flujos de trabajo secuenciales.
    • Responsabilidad clara: el líder alinea el objetivo.
  • Debilidades

    • Cuellos de botella: depender del líder puede retrasar el progreso.

    • Punto único de falla: vulnerable a problemas de líder.

  • Mejores casos de uso

    • Automatización del flujo de trabajo: aprobaciones de varios pasos.

    • Generación de documentos: secciones supervisadas por un líder.

Arquitecturas horizontales de IA

  • Estructura

    • Modelo de colaboración entre pares: los agentes trabajan como iguales en un sistema descentralizado, colaborando libremente para resolver tareas.6

  • Características principales

    • Colaboración distribuida: todos los agentes comparten recursos e ideas.

    • Decisiones descentralizadas: toma de decisiones impulsada por el grupo para la autonomía colaborativa.

  • Fortalezas

    • Resolución dinámica de problemas: fomenta la innovación.

    • Procesamiento paralelo: los agentes trabajan en tareas simultáneamente.

  • Debilidades

    • Desafíos de coordinación: la mala gestión puede causar ineficiencias.

    • Decisiones más lentas: demasiada deliberación.

  • Mejores casos de uso

    • Lluvia de ideas : generación de ideas diversas.

    • Resolución de problemas complejos: abordaje de desafíos interdisciplinarios.

Arquitecturas de IA híbrida

  • Estructura

    • Combinan liderazgo estructurado con flexibilidad colaborativa; cambios de liderazgo basados en los requisitos de la tarea.

  • Características principales

    • Liderazgo dinámico: el liderazgo se adapta a la fase de la tarea.

    • Liderazgo colaborativo: los líderes involucran a sus pares abiertamente.

  • Fortalezas

    • Versatilidad: combina las fortalezas de ambos modelos.

    • Adaptabilidad: maneja tareas que requieren tanto estructura como creatividad.

  • Debilidades

    • Complejidad: equilibrar las funciones de liderazgo y la colaboración requiere mecanismos sólidos.

    • Gestión de recursos: mayor exigencia.

  • Mejores casos de uso

    • Tareas versátiles: planificación estratégica o proyectos en equipo.

    • Procesos dinámicos: equilibrio de las demandas estructuradas y creativas.

Diagrama de arquitecturas de agente único y multiagente

Marcos agénticos

Los marcos de agente se refieren a infraestructuras de diseño o modelos que definen la manera en que los agentes (ya sean artificiales o naturales) pueden realizar tareas, tomar decisiones e interactuar con su entorno de manera autónoma e inteligente. Estas infraestructuras proporcionan la estructura y las pautas sobre cómo operan, razonan y se adaptan los agentes en diversos entornos.

Arquitecturas reactivas

Las arquitecturas reactivas asignan situaciones directamente a acciones. Son reflexivas y toman decisiones basadas en estímulos inmediatos del entorno en lugar de basarse en la memoria o las capacidades predictivas. No pueden aprender del pasado ni planificar para el futuro. 

Arquitecturas deliberativas

Una arquitectura deliberativa es un sistema de IA que toma decisiones basadas en el razonamiento, la planificación y los modelos internos del mundo. A diferencia de los agentes reactivos, los agentes deliberativos analizan su entorno, predicen resultados futuros y toman decisiones informadas antes de actuar.

Arquitecturas cognitivas

Una arquitectura cognitiva agéntica es un sistema avanzado de IA que imita el pensamiento, el razonamiento, el aprendizaje y la toma de decisiones similares a los humanos.

Estos agentes incorporan elementos de percepción, memoria, razonamiento y adaptación, cada uno representado por módulos individuales, lo que les permite operar en entornos complejos e inciertos mientras mejoran con el tiempo. Este es el tipo más avanzado de arquitectura agéntica.

Una arquitectura BDI (más comúnmente conocida como modelo o marco) está diseñada para modelar la toma de decisiones racional en agentes inteligentes, y se basa en el marco creencia-deseo-intención (BDI).

Esta arquitectura modela el razonamiento humano en un agente BDI, con:

  • Creencias (B): el conocimiento del agente del mundo, que podría incluir su comprensión del entorno, la situación actual y cualquier dato sensorial.

Por ejemplo: "La puerta está cerrada".

  • Deseos (D): las metas u objetivos del agente, que representan lo que quiere lograr. Los deseos no son necesariamente acciones, sino objetivos de alto nivel.

Por ejemplo: "Quiero entrar en la habitación".

  • Intenciones (I): el curso de acción al que se compromete el agente para lograr sus deseos. Las intenciones representan acciones planificadas que el agente persigue activamente, considerando sus creencias y deseos.

Por ejemplo: "Abriré la puerta para entrar en la habitación".

Notas de pie de página

1 Bandura A. “Social cognitive theory: an agentic perspective.” Annu Rev Psychol. 2001;52:1-26. doi: 10.1146/annurev.psych.52.1.1. https:\/\/pubmed.ncbi.nlm.nih.gov\/11148297\/.

2 Bandura A. “Social cognitive theory: an agentic perspective.”

3 T. Masterman, S. Besen, M. Sawtell y A. Chao, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey", arXiv preprint arXiv:2404.11584, Abr. 2024. [En línea]. Disponible: https:\/\/arxiv.org\/abs\/2404.11584.

4 E. H. Durfee y V. Lesser, "Negotiating Task Decomposition and Allocation Using Partial Global Planning", en Distributed Artificial Intelligence Volume II, ed. L. Gasser and M. Huhns (London: Pitman Publishing; San Mateo, CA: Morgan Kaufmann, 1989), 229–244.

5 Masterman, et al, “, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."

6 Masterman, et al, "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey."

Soluciones relacionadas
Desarrollo de agentes de IA de IBM 

Permita a los desarrolladores crear, desplegar y monitorear agentes de IA con el estudio IBM watsonx.ai.

Explore watsonx.ai
Agentes de IA y asistentes de IBM

Cree una productividad revolucionaria con uno de los conjuntos de capacidades más completos de la industria para ayudar a las empresas a crear, personalizar y gestionar asistentes y agentes de IA. 

Explore los agentes de IA
IBM Granite

Logre un ahorro de más del 90 % en costos de energía con los modelos más pequeños y abiertos de Granite, diseñados para mejorar la eficiencia de los desarrolladores. Estos modelos preparados para empresas ofrecen un rendimiento excepcional contra puntos de referencia de seguridad y en una amplia gama de tareas empresariales, desde la ciberseguridad hasta el RAG.

Explorar Granite
Dé el siguiente paso

Automatice sus complejos flujos de trabajo y cree una productividad revolucionaria con uno de los conjuntos de capacidades más completos de la industria para ayudar a las empresas a crear, personalizar y gestionar agentes y asistentes de IA. 

Explore el desarrollo de agentes de watsonx.ai Descubra watsonx Orchestrate