Las últimas tendencias de IA presentadas por expertos
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Un agente basado en objetivos es un agente de inteligencia artificial que incorpora un enfoque proactivo orientado a objetivos para la resolución de problemas y la toma de decisiones. Es un ejemplo de IA agéntica, en la que los sistemas de IA realmente actúan en nombre de los usuarios (a diferencia, por ejemplo, de un simple chatbot de atención al cliente de LLM).
En la jerarquía de cinco niveles de complejidad de los agentes, los agentes basados en objetivos se ubican en el medio. Son más complejos que tanto los agentes reflejos simples (que siguen reglas predefinidas) como los agentes reflejos basados en modelos (que agregan un modelo interno del mundo). Pero son menos complejos que tanto los agentes basados en utilidades (que pueden calcular compensaciones usando una función llamada utilidad) como los agentes de aprendizaje (que se pueden adaptar y mejorar con el tiempo, a menudo mediante aprendizaje por refuerzo o aprendizaje profundo).
Los agentes basados en objetivos superan a los agentes reflejos más simples al agregar una función de planificación que considera estados futuros, pero no llegan a emplear las evaluaciones dinámicas de agentes más sofisticados, sino que confían en estrategias preprogramadas o árboles de decisión en la búsqueda de sus objetivos.
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Un ejemplo de agente basado en objetivos proviene del ámbito de la robótica, concretamente de la automatización de almacenes. Un robot de almacén que necesita recoger un determinado artículo de un determinado estante podría reaccionar a los obstáculos inmediatos, como un robot aspirador que choca contra las paredes (un “agente puramente reactivo”). Sin embargo, sería más eficiente planificar un camino que minimice desvíos y evite obstáculos conocidos. Por ejemplo, en un entorno dinámico como un almacén moderno, un módulo de planificación puede consultar su base de conocimientos, observar el estado actual y mapear estados futuros (por ejemplo, por concientización de los movimientos planeados de otros bots), todo esto para alcanzar su resultado deseado de manera eficiente.
Los agentes basados en objetivos operan en cuatro etapas:
Primero, se le da al agente una definición precisa de éxito. A diferencia de los agentes basados en utilidades, los agentes basados en objetivos operan en condiciones binarias y lógicas. Pero si bien un agente basado en objetivos puede definir el éxito como el cambio de bits de un estado a otro, no hay nada que impida que el “objetivo” singular de dicho agente sea un conjunto moderadamente complejo de lógica proposicional y de primer orden. Por ejemplo, un robot podría establecer el objetivo de “para cada paquete actualmente marcado como urgente, entregar cada uno desde su ubicación de inventario respectiva al muelle de envío”. El objetivo es fundamentalmente binario (uno puede tener éxito o fracasar en este objetivo), pero también tiene múltiples componentes, lo que permite la complejidad.
Si bien sería bueno que un usuario humano defina objetivos con precisión, también es posible que un humano ingrese un objetivo más impreciso (“optimizar el cumplimiento en las vacaciones”) y que un LLM cubra la brecha y defina esto en una meta o conjunto de metas más preciso (por ejemplo, “estimar el rendimiento diario del sistema”, “definir los paquetes P como de mayor prioridad”; “establecer meta para entregar paquetes P dentro de las 24 horas”).
Una vez definido su objetivo, el agente basado en objetivos lleva a cabo una breve planificación antes de pasar a la ejecución. Por ejemplo, en el caso del almacén, el agente dedicará algún tiempo a modelar las condiciones actuales y potenciales para elegir una ruta óptima para cumplir con los pedidos de mayor prioridad a tiempo, decidiendo, por ejemplo, con qué frecuencia debe realizar viajes desde el inventario estantes hasta la bahía de envío.
Por supuesto, los planes solo son tan buenos como la realidad con la que se enfrentan. Mientras que algunos agentes basados en objetivos son “conservadores” y prefieren ceñirse a sus planes hasta que estos resultan literalmente imposibles, los enfoques más flexibles provienen de los agentes “oportunistas” que, si se topan con obstáculos en sus planes, calculan con flexibilidad una mejor acción siguiente: algo muy parecido a lo que hace Google Maps cuando busca una ruta alternativa ante un atasco inesperado.
En el caso de un robot de almacén, los sensores de la máquina pueden ayudar a supervisar la situación en tiempo real, enviando datos cruciales al módulo de planificación. Por ejemplo, si un sensor detecta que el “paquete de comprensión” del objetivo secundario ha fallado por alguna razón, un agente basado en objetivos puede intentar diagnosticar la causa, planificar un enfoque alternativo o solicitar refuerzos.
La decisión sobre qué tipo de agente de IA utilizar depende del tipo de problema que se deba resolver. Mientras se les asignen objetivos específicos, los modelos de IA que subyacen a los agentes basados en objetivos pueden tomar decisiones informadas y gestionar tareas complejas, pero los criterios de éxito deben ser sencillos (a menudo binarios).
Sin embargo, en situaciones donde la adaptabilidad en tiempo real es crucial, o donde hay múltiples objetivos a optimizar, las empresas pueden pasar de agentes basados en objetivos a una opción más sofisticada, como los agentes basados en utilidades. Un ejemplo canónico aquí sería un vehículo autónomo. Cuando un pasajero solicita un vehículo autónomo, hay varios objetivos que deben equilibrarse: la duración del trayecto, el precio, evitar el tráfico y la seguridad. Para ofrecer la mejor experiencia al cliente, un vehículo impulsado por IA debe llevar a cabo complejos procesos de toma de decisiones, evaluando las distintas ventajas e inconvenientes de las posibles acciones. La función de utilidad resultante dictará las acciones del agente.
No hay nada que diga que un sistema agéntico no pueda “mezclar y combinar” tipos de agentes, con cada agente adaptado a la complejidad del problema en cuestión. Por ejemplo, uno puede imaginarse un ejemplo de atención médica: un hospital que emplea no solo agentes basados en objetivos para ejecutar flujos de trabajo, sino también agentes de los otros cuatro tipos examinados.
En el nivel más simple, un agente reflejo llamado Vitals Monitor podría simplemente monitorear los signos vitales de todos los pacientes. Su objetivo específico es activar una alarma si la frecuencia cardíaca de un paciente, por ejemplo, baja de cierto nivel para así alertar mejor a un médico o enfermero sobre la intervención humana. Dicho agente puede basarse en algoritmos simples de si/entonces.
Un nivel superior, un agente reflejo basado en modelos llamado Inventory Agent, podría gestionar el inventario de medicamentos y suministros para el hospital. Mantiene un modelo interno de inventario actual, patrones de uso históricos y tiempos de respuesta de los asociados de negocios de la cadena de suministro, lo mejor para agilizar los pedidos de recarga.
En tercer lugar, un agente de nivel superior basado en objetivos, llamado Planificador de Alta, podría trabajar a la inversa a partir del objetivo binario simple de dar de alta al paciente. Se basaría en estrategias preprogramadas y árboles de decisión, al tiempo que consideraría estados futuros, para coordinar laboratorios, medicamentos y aprobaciones de especialistas, incluidas todas las subtareas necesarias. Si un paso se retrasa, su módulo de planificación puede volver a ejecutarse, formulando un nuevo plan. (Es probable que el agente basado en objetivos, como la mayoría de estos agentes, se ajuste en un modelo de lenguaje grande).
En cuarto lugar, un agente basado en utilidades, llamado Bed Assignment Optimizer, podría asignar pacientes a varias habitaciones, al tiempo que intenta maximizar la seguridad, la satisfacción y el rendimiento. Dado que debe gestionar múltiples bienes y compensaciones complejas, el agente trabaja con una función de utilidades evaluando variables como el contagio, los niveles de personal y la gravedad de las enfermedades.
En quinto lugar, y en el nivel más alto, un agente de aprendizaje llamado Intake Assistant emplea el machine learning, buscando patrones de experiencias pasadas para mejorar las preguntas de triaje, marcar pacientes de alto riesgo y reducir los pasos redundantes. A diferencia de los agentes de nivel inferior, este agente de aprendizaje debe evaluar continuamente conjuntos de datos en constante evolución, buscando patrones profundos que podrían pasar desapercibidos para los seres humanos.
Los cinco agentes trabajan juntos como un conjunto de asistentes virtuales para resolver problemas complejos. Con una coordinación adecuada, así como la integración de diversas capacidades —desde el procesamiento del lenguaje natural (PLN) y la IA generativa hasta la visión artificial y las llamadas a herramientas API—, el sistema multiagente es sencillo donde debe serlo y complejo donde debe serlo.
Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.
Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.
Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.