¿Qué es la planificación de agentes de IA?

Autores

Cole Stryker

Staff Editor, AI Models

IBM Think

¿Qué es la planificación de agentes de IA?

La planificación de agentes de IA se refiere al proceso mediante el cual un agente de inteligencia artificial (IA) determina una secuencia de acciones para lograr un objetivo específico. Implica la toma de decisiones, la priorización de objetivos y la secuenciación de acciones, a menudo utilizando varios algoritmos y marcos de planificación.

La planificación de agentes de IA es un módulo común a muchos tipos de agentes que existe junto con otros módulos como la percepción, el razonamiento, la toma de decisiones, la acción, la memoria, la comunicación y el aprendizaje. La planificación funciona junto con estos otros módulos para ayudar a garantizar que los agentes logren los resultados deseados por sus diseñadores.

No todos los agentes pueden planificar. A diferencia de los simples agentes reactivos que responden inmediatamente a las entradas, los agentes de planificación anticipan estados futuros y generan un plan de acción estructurado antes de la ejecución. Esto hace que la planificación de la IA sea esencial para las tareas de automatización que requieren una toma de decisiones, optimización y adaptabilidad de varios pasos.

Las últimas novedades sobre tecnología, respaldadas por conocimientos de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Se ha suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Cómo funciona la planificación de agentes de IA

Los avances en los modelos de lenguaje de gran tamaño (LLM) como el GPT de OpenAI y las técnicas relacionadas que implican algoritmos de machine learning han dado lugar al auge de la IA generativa (IA gen) de los últimos años, y otros avances han llevado al campo emergente de los agentes autónomos.

Al integrar herramientas, API, interfaces de hardware y otros recursos externos, los sistemas de IA agéntica son cada vez más autónomos, capaces de la toma de decisiones en tiempo real y expertos en la resolución de problemas en diversos caso de uso.

Los agentes complejos no pueden actuar sin tomar una decisión, y no pueden tomar buenas decisiones sin hacer primero un plan. La planificación agéntica consta de varios componentes clave que trabajan juntos para fomentar una toma de decisiones óptima.

Definición de objetivo

El primer paso y el más crítico en la planificación de la IA es definir un objetivo claro. El objetivo sirve como principio rector para el proceso de toma de decisiones del agente, determinando el estado final que pretende alcanzar. Los objetivos pueden ser estáticos, permaneciendo sin cambios durante todo el proceso de planificación, o dinámicos, ajustándose en función de las condiciones ambientales o las interacciones de los usuarios.

Por ejemplo, un coche autónomo podría tener el objetivo de llegar a un destino específico de manera eficiente y respetando las normas de seguridad. Sin un objetivo bien definido, un agente carecería de dirección, lo que conduciría a un comportamiento errático o ineficiente.

Si el objetivo es complejo, los modelos de IA agéntica lo dividirán en subobjetivos más pequeños y manejables en un proceso llamado descomposición de tareas. Esto permite que el sistema se centre en tareas complejas de forma jerárquica.

Los LLM desempeñan un papel vital en la descomposición de tareas, dividiendo un objetivo de alto nivel en subtareas más pequeñas y luego ejecutando esas subtareas a través de varios pasos. Por ejemplo, un usuario podría pedirle a un chatbot con una instrucción en lenguaje natural que planifique un viaje.

El agente primero descompondría la tarea en componentes como reservar vuelos, encontrar hoteles y planificar un itinerario. Una vez descompuesto, el agente puede utilizar interfaces de programación de aplicaciones (API) para obtener datos en tiempo real, comprobar precios y hasta sugerir destinos.

Representación estatal

Para planificar eficazmente, un agente debe tener una comprensión estructurada de su entorno. Esta comprensión se logra a través de la representación estatal, que modela las condiciones actuales, las limitaciones y los factores contextuales que influyen en la toma de decisiones.

Los agentes tienen algunos conocimientos incorporados de sus datos de entrenamiento o conjuntos de datos que representan interacciones anteriores, pero la percepción es necesaria para que los agentes tengan una comprensión en tiempo real de su entorno. Los agentes recopilan datos a través de la entrada sensorial, lo que le permite modelar su entorno, junto con la entrada del usuario y los datos que describen su propio estado interno.

La complejidad de la representación estatal varía en función de la tarea. Por ejemplo, en un juego de ajedrez, el estado incluye la posición de todas las piezas en el tablero, mientras que en un sistema de navegación robótica, el estado puede incluir coordenadas espaciales, obstáculos y condiciones del terreno.

La precisión de la representación del estado influye directamente en la capacidad de un agente para tomar decisiones informadas, ya que determina hasta qué punto puede predecir los resultados de sus acciones.

Secuencia de acciones

Una vez que el agente ha establecido su objetivo y evaluado su entorno, debe determinar una secuencia de acciones que lo harán pasar de su estado actual al estado objetivo deseado. Este proceso, conocido como secuenciación de acciones, implica estructurar un conjunto lógico y eficiente de pasos que el agente debe seguir.

El agente debe identificar las acciones potenciales, reducir esa lista a las acciones óptimas, priorizarlas e identificar las dependencias entre las acciones y los pasos condicionales en función de los posibles cambios en el entorno. El agente puede asignar recursos a cada paso de la secuencia o programar acciones en función de las restricciones ambientales.

Por ejemplo, un robot aspirador debe decidir el camino más efectivo para limpiar una habitación, asegurándose de que cubra todas las áreas necesarias sin repeticiones innecesarias. Si la secuencia de acciones no está bien planificada, el agente de IA puede tomar medidas ineficientes o redundantes, lo que provoca un desperdicio de recursos y un aumento del tiempo de ejecución.

El marco ReAct es una metodología utilizada en la IA para gestionar la toma de decisiones dinámica. En el marco de ReAct, el razonamiento se refiere al proceso cognitivo en el que el agente determina qué acciones o estrategias se requieren para lograr un objetivo específico.

Esta fase es similar a la fase de planificación en la IA agéntica, en la que el agente genera una secuencia de pasos para resolver un problema o cumplir una tarea. Otros marcos emergentes son ReWOO, RAISE y Reflexion, cada uno de los cuales tiene sus propias fortalezas y debilidades.

Optimización y evaluación

La planificación de la IA a menudo implica seleccionar la ruta más óptima para lograr un objetivo, especialmente cuando hay varias opciones disponibles. La optimización ayuda a garantizar que la secuencia de acciones elegida por un agente sea la más eficiente, rentable o beneficiosa dadas las circunstancias. Este proceso a menudo requiere evaluar diferentes factores, como el tiempo, el consumo de recursos, los riesgos y las posibles recompensas.

Por ejemplo, un robot de almacén encargado de recuperar artículos debe determinar la ruta más corta y segura para evitar colisiones y reducir el tiempo operativo. Sin una optimización adecuada, los agentes de IA podrían ejecutar planes que son funcionales pero subóptimos, lo que genera ineficiencias. Se pueden utilizar varios métodos para optimizar la toma de decisiones, entre ellos:

Búsqueda heurística

Los algoritmos de búsqueda heurística ayudan a los agentes a encontrar soluciones óptimas al estimar la mejor ruta hacia un objetivo. Estos algoritmos se basan en funciones heurísticas: estimaciones matemáticas de la proximidad de un estado dado al objetivo deseado. Las búsquedas heurísticas son especialmente eficaces en entornos estructurados donde los agentes necesitan encontrar rutas óptimas rápidamente.

Aprendizaje de refuerzo

El aprendizaje por refuerzo permite a los agentes optimizar la planificación mediante ensayo y error, aprendiendo qué secuencias de acciones conducen a los mejores resultados a lo largo del tiempo. Un agente interactúa con un entorno, recibe feedback en forma de recompensas o penalizaciones y refina sus estrategias en consecuencia.

Planificación probabilística

En escenarios del mundo real, los agentes de IA operan a menudo en entornos inciertos en los que los resultados no son deterministas. Los métodos de planificación probabilística tienen en cuenta la incertidumbre evaluando múltiples resultados posibles y seleccionando las acciones con la mayor utilidad esperada.

Colaboración

La planificación de un solo agente es una cosa, pero en un sistema multiagente, los agentes de IA deben trabajar de forma autónoma mientras interactúan entre sí para lograr objetivos individuales o colectivos.

El proceso de planificación de los agentes de IA en un sistema multiagente es más complejo que el de un solo agente, porque los agentes no solo deben planificar sus propias acciones, sino también tener en cuenta las acciones de otros agentes y cómo interactúan sus decisiones con las de los demás.

En función de la arquitectura agéntica, cada agente del sistema suele tener sus propios objetivos individuales, que pueden implicar la realización de tareas específicas o la maximización de una función de recompensa. En muchos sistemas multiagente, los agentes necesitan trabajar juntos para lograr objetivos compartidos.

Estos objetivos podrían definirse mediante un sistema global o surgir de las interacciones de los agentes. Los agentes necesitan mecanismos para comunicar y alinear sus objetivos, especialmente en escenarios cooperativos. Esto podría hacerse a través de mensajes explícitos, definiciones de tareas compartidas o coordinación implícita.

La planificación en sistemas multiagente puede ser centralizada, donde una sola entidad o controlador, probablemente un agente LLM, genera el plan para todo el sistema.

Cada agente recibe instrucciones o planes de esta autoridad central. También puede ser descentralizado, en el que los agentes generan sus propios planes, pero trabajan en colaboración para ayudar a garantizar que se alinean entre sí y contribuyen a los objetivos globales, lo que a menudo requiere comunicación y negociación.

Este proceso colaborativo de toma de decisiones mejora la eficiencia, reduce los sesgos en la ejecución de tareas, ayuda a evitar alucinaciones mediante la validación cruzada y la creación de consenso, y anima a los agentes a trabajar hacia un objetivo común.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones del mundo real

Descubra cómo la IA basada en objetivos y servicios se adapta a flujos de trabajo y entornos complejos.

Después de la planificación

Las fases en los flujos de trabajo de IA agéntica no siempre se producen de forma estrictamente lineal paso a paso. Aunque estas fases suelen ser distintas en la conceptualización, en la práctica suelen estar entrelazadas o ser iterativas, dependiendo de la naturaleza de la tarea y la complejidad del entorno en el que opera el agente.

Las soluciones de IA pueden diferir en función de su diseño, pero en un flujo de trabajo agéntico típico, la siguiente fase después de la planificación es la ejecución de acciones, en la que el agente lleva a cabo las acciones definidas en el plan. Esto implica realizar tareas e interactuar con sistemas externos o bases de conocimiento con generación aumentada por recuperación (RAG), uso de herramientas y llamadas a funciones (llamadas a herramientas).

La creación de agentes de IA para estas capacidades podría implicar a LangChain. Los scripts de Python, las estructuras de datos JSON y otras herramientas programáticas mejoran la capacidad de la IA para tomar decisiones.

Después de ejecutar planes, algunos agentes pueden usar la memoria para aprender de sus experiencias e iterar su comportamiento en consecuencia.

En entornos dinámicos, el proceso de planificación debe ser adaptativo. Los agentes reciben continuamente feedback sobre el entorno y las acciones de otros agentes y deben ajustar sus planes en consecuencia. Esto puede implicar la revisión de los objetivos, el ajuste de las secuencias de acciones o la adaptación a los nuevos agentes que entran o salen del sistema.

Cuando un agente detecta que su plan actual ya no es viable (por ejemplo, debido a un conflicto con otro agente o a un cambio en el entorno), puede replantearse para ajustar su estrategia. Los agentes pueden ajustar sus estrategias utilizando el razonamiento de la cadena de pensamiento, un proceso en el que reflexionan sobre los pasos necesarios para alcanzar su objetivo antes de actuar.

Soluciones relacionadas
Agentes de IA para empresas

Cree, implemente y gestione potentes asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

    Explore watsonx Orchestrate
    Soluciones de agente de IA de IBM

    Construya el futuro de su empresa con soluciones de IA en las que puede confiar.

    Explore las soluciones de los agentes de IA
    Servicios de IA de IBM Consulting

    Los servicios de IA de IBM Consulting ayudan a reinventar la forma de trabajar de las empresas usando IA para la transformación.

    Explore los servicios de inteligencia artificial
    Dé el siguiente paso

    Tanto si opta por personalizar las aplicaciones y habilidades prediseñadas como si prefiere crear e implementar servicios agentivos personalizados mediante un estudio de IA, la plataforma IBM watsonx le ofrece todo lo que necesita.

    Explore watsonx Orchestrate Explore watsonx.ai