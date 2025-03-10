¿Cuáles son los componentes de los agentes de IA?

Autores

Cole Stryker

Staff Editor, AI Models

IBM Think

¿Cuáles son los componentes de los agentes de IA?

Los agentes de IA toman decisiones inteligentes e interactúan perfectamente con los sistemas digitales, lo que requiere una intervención humana mínima. Pero, ¿qué hace que estos agentes sean realmente inteligentes? En esencia, los agentes de IA se basan en un conjunto de componentes interconectados que les permiten percibir su entorno, procesar información, decidir, colaborar, tomar medidas significativas y aprender de su experiencia.

Hay muchos tipos de agentes de IA con diferentes capacidades, y el comportamiento de los agentes se rige por la arquitectura de agentes de IA en la que operan.

Por un lado, los agentes reactivos son simples agentes reflejos que responden instantáneamente a los estímulos, a veces con actuadores que les permiten interactuar con su entorno. Los agentes reflejos basados en modelos utilizan un modelo interno del entorno para mejorar su toma de decisiones. En el otro extremo del espectro, los agentes cognitivos proactivos son capaces de razonamiento avanzado y planificación a largo plazo. Algunos agentes se especializan en tareas específicas y otros están diseñados para liderar a otros agentes como una especie de "director" en una orquestación de IA.

Con esa salvedad, estos son los componentes principales de los agentes de la inteligencia artificial, cada uno crucial para crear sistemas adaptativos e inteligentes.

Percepción y manejo de entradas

IA agéntica debe ser capaz de Ingesta e interpretar información de diversas fuentes. Las entradas pueden presentarse en diferentes formas, incluidas consultas de usuarios, registros del sistema, datos estructurados de API o lecturas de sensores. El agente debe ser capaz de analizar y comprender esta información, a menudo utilizando tecnologías de IA, como el procesamiento de lenguaje natural (PLN) para entradas basadas en texto o técnicas de extracción de datos para fuentes estructuradas. La complejidad del módulo de percepción depende del propósito del agente; por ejemplo, un chatbot como Alexa de Amazon depende del NLP para interpretar la entrada humana, mientras que un automóvil autónomo procesa las imágenes de la cámara, los datos LIDAR y las señales de radar para reconocer objetos y navegar por las carreteras. Esta fusión multisensor superpuesta junto con la visión artificial proporciona a los vehículos autónomos una percepción de su entorno en tiempo real.

Una vez que se reciben los datos sin procesar, el módulo de percepción los limpia, procesa y estructura en un formato utilizable. A menudo se usan soluciones de IA como la conversión de speech to text, la detección de objetos, el análisis de sentimientos, el reconocimiento de entidades y la detección de anomalías. En los sistemas de IA en tiempo real, la percepción debe ser eficiente y adaptativa, además de filtrar el ruido y priorizar la información relevante. La precisión y robustez de este módulo impacta directamente en la efectividad del agente de IA, ya que las malas interpretaciones en la percepción pueden conducir a decisiones y acciones incorrectas.

Es posible que se requieraingeniería rápida para guiar con éxito el comportamiento de los agentes dentro de ciertos flujos de trabajo.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones reales

Descubra cómo la IA orientada a objetivos y basada en utilidades se adapta a los flujos de trabajo y entornos complejos.
Construir, desplegar y monitorear agentes de IA

Planeación y descomposición de tareas

A diferencia de los agentes reactivos que responden instintivamente a entradas inmediatas, los agentes de planificación trazan secuencias de acciones antes de la ejecución. Este módulo es importante para aplicaciones de IA, como robots autónomos, optimización logística y sistemas de programación impulsados por IA.

Una vez que la IA comprende la entrada, necesita desglosar el problema complejo en tareas más pequeñas y manejables. Algunos componentes clave son la secuenciación de acciones y la determinación de dependencias entre tareas. Los agentes de IA se basan en la lógica, los modelos de machine learning o las heurísticas predefinidas para establecer el mejor curso de acción.

En los sistemas multiagente, la planificación se vuelve aún más sofisticada, ya que los agentes deben coordinar o negociar los recursos. La planificación eficaz también incorpora la incertidumbre, aprovechando los modelos probabilísticos de modelos de IA para prepararse para eventos inesperados. Sin un módulo de planificación sólido, un agente podría tener dificultades con las tareas a largo plazo, no optimizar los procesos o volverse ineficiente al lidiar con condiciones cambiantes.

Memoria

El módulo de memoria permite al agente de IA retener y recuperar información, lo que ayuda a garantizar que pueda aprender de interacciones pasadas y mantener el contexto a lo largo del tiempo. Este módulo suele dividirse en memoria a corto y largo plazo. La memoria a corto plazo almacena el contexto basado en la sesión, lo que permite a un asistente de IA recordar mensajes recientes en una conversación y mantener la coherencia. Esto permite el aprendizaje en contexto. La memoria a largo plazo, alternativamente, consiste en bases de conocimiento estructuradas, incorporaciones vectoriales y datos históricos a los que el agente puede referirse al tomar decisiones.

La persistencia de la memoria y la organización son cruciales para mejorar la personalización en aplicaciones como los bots de atención al cliente, los motores de recomendación y los asistentes virtuales. Sin un módulo de memoria eficiente, un agente funciona sin estado, lo que obliga a los usuarios a repetir la información y afecta la experiencia del usuario. La memoria también desempeña un papel en los sistemas multiagente, donde los agentes comparten y actualizan una base de conocimientos colectiva para mejorar la colaboración.

Razonamiento y toma de decisiones

Los chatbots simples de la década anterior usaban reglas predefinidas para elegir entre un conjunto limitado de decisiones. Los agentes de IA más avanzados trabajan para evaluar diferentes rutas de solución, evaluar el rendimiento y perfeccionar su enfoque con el tiempo. En el núcleo de un agente se encuentra el módulo de razonamiento. Este módulo determina cómo reacciona un agente a su entorno sopesando diferentes factores, evaluando probabilidades y aplicando reglas lógicas o comportamientos aprendidos. Dependiendo de la complejidad de la IA, el razonamiento puede estar basado en reglas, probabilístico, heurístico o impulsado por modelos de aprendizaje profundo. Dos paradigmas de razonamiento populares son ReAct (razonamiento y acción) y ReWOO (razonamiento sin observación).

Varios tipos de agentes abordan el razonamiento de manera diferente. Por ejemplo, los agentes basados en objetivos toman decisiones a través de la consideración de un objetivo predefinido y la selección de acciones que conduzcan a lograr ese objetivo específico. Estos agentes se centran en el hecho de si se logra un resultado, en lugar de optimizar para obtener el mejor resultado posible. Mientras que los agentes basados en la utilidad llevan la toma de decisiones un paso más allá al evaluar no solo si se cumple un objetivo, sino también cuán óptimo es el resultado, con base en una función de utilidad.

Los sistemas de IA simples y basados en reglas siguen una lógica predefinida, como "si sucede X, haga Y". Los sistemas más avanzados utilizan la inferencia bayesiana, el aprendizaje por refuerzo o neural networks para adaptarse dinámicamente a nuevas situaciones. Este módulo también puede implementar el razonamiento de cadena de pensamiento y técnicas de resolución de problemas de varios pasos, que son esenciales para aplicaciones de IA, como el análisis financiero automatizado o la revisión de contratos legales. La capacidad del agente para razonar eficazmente y tomar decisiones informadas determina la inteligencia y confiabilidad generales de un agente en el manejo de tareas complejas.

Llamadas de acciones y de herramientas

El módulo de acción pone en práctica las decisiones del agente en el mundo real, permitiéndole interactuar con usuarios, sistemas digitales o incluso entornos físicos. Después de que los módulos de razonamiento y planeación determinen una respuesta adecuada, el módulo de acción ejecuta los pasos necesarios, ya sea llamar a una herramienta como una API o interactuar con el entorno externo al mover un brazo robótico.

Los flujos de trabajo de agentes pueden requerir acceso a herramientas externas, conjuntos de datos, API y sistemas de automatización para completar tareas. La llamada a herramientas es el mecanismo utilizado en los sistemas de IA agéntica donde un agente invoca herramientas externas, API o funciones para ampliar sus capacidades más allá de su razonamiento y conocimiento nativos. Esto permite que la IA realice acciones, recupere datos en tiempo real, ejecute cálculos e interactúe con sistemas externos de forma dinámica.

En resumen, la llamada de herramientas permite que un modelo de lenguaje grande (LLM) interactúe con herramientas estructuradas, lo que otorga al modelo acceso a información más allá de los datos utilizados en el entrenamiento.

Comunicación

El módulo de comunicación permite a un agente interactuar con humanos, otros agentes o sistemas de software externos, lo que ayuda a garantizar una integración y colaboración perfectas. Este módulo maneja la generación de lenguaje natural (NLG) y la mensajería basada en protocolos. La sofisticación de la comunicación varía; los agentes simples pueden seguir scripts predefinidos, mientras que los agentes avanzados utilizan modelos de IA generativa entrenados en grandes cantidades de datos para generar respuestas dinámicas y sensibles al contexto.

El componente de comunicación es importante para los sistemas multiagente (MAS) para compartir conocimientos, negociar acciones o coordinar tareas. Por ejemplo, en finanzas, varios agentes pueden analizar las tendencias del mercado e intercambiar insights para optimizar las estrategias comerciales. Del mismo modo, las redes de la cadena de suministro impulsadas por IA dependen de agentes de software para sincronizar los datos de inventario, predecir la escasez y optimizar la logística. En casos de uso orientados a humanos, como asistentes virtuales o chatbots, este módulo ayuda a garantizar que las respuestas se sientan naturales, informativas y atractivas. La capacidad de comunicarse de manera efectiva con agentes humanos mejora la usabilidad de un agente, lo que lo hace más valioso en diferentes dominios.

Aprendizaje y adaptación

Una característica clave de los agentes inteligentes es su capacidad para aprender de experiencias pasadas y mejorar con el tiempo. Los algoritmos de aprendizaje permiten a un agente reconocer patrones, refinar predicciones y ajustar sus procesos de toma de decisiones en función de la retroalimentación. Esto se logra a través de varios paradigmas de aprendizaje, incluido el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje por refuerzo .

Por ejemplo, un chatbot de atención al cliente con un módulo de aprendizaje puede analizar interacciones pasadas para mejorar su tono, precisión y eficiencia de respuesta. Del mismo modo, un sistema de recomendaciones puede refinar continuamente sus sugerencias en función de las preferencias del usuario. Los agentes de aprendizaje por refuerzo, como los que se utilizan en robótica y juegos, optimizan sus acciones maximizando las recompensas y minimizando las penalizaciones. Sin un módulo de aprendizaje, un sistema de IA permanecería estático e incapaz de adaptarse a las nuevas tendencias, las expectativas de los usuarios o los desafíos imprevistos, como las fallas de dependencia.

En diversas industrias, desde la atención médica hasta la cadena de suministro y el transporte, podemos esperar el despliegue de muchos más agentes, gracias a su impresionante escalabilidad. Los líderes deberán mantenerse al tanto del estado actual de la tecnología de agente para aprovechar al máximo estas herramientas y, al mismo tiempo, tener en cuenta las consideraciones éticas.

