¿Qué es la RAG agentiva?

Autores

Staff writer

Staff Editor, AI Models

IBM Think

La RAG agéntica es el uso de agentes de IA para facilitar la generación aumentada por recuperación (RAG). Los sistemas de RAG agéntica añaden agentes de IA al pipeline de RAG para aumentar la adaptabilidad y la precisión. En comparación con los sistemas RAG tradicionales, la RAG agéntica permite que los modelos de lenguaje de gran tamaño (LLM) realicen la recuperación de información de múltiples fuentes y gestionen flujos de trabajo más complejos.

¿Qué es RAG?

La generación aumentada por recuperación es una aplicación de inteligencia artificial (IA) que conecta un modelo de IA generativa con una base de conocimientos externa. Los datos de la base de conocimientos aumentan las consultas de los usuarios con más contexto para que el LLM pueda generar respuestas más precisas. La RAG permite que los LLM sean más precisos en contextos específicos de un dominio sin necesidad de fine-tuning.

En lugar de depender únicamente de los datos de entrenamiento, los modelos de IA habilitados para RAG pueden acceder a los datos actuales en tiempo real a través de API y otras conexiones a fuentes de datos. Un pipeline RAG estándar consta de dos modelos de IA:

El componente de recuperación de información, normalmente un modelo de embedding emparejado con una base de datos vectorial que contiene los datos que se van a recuperar.

El componente de IA generativa, normalmente un LLM.

En respuesta a las consultas de los usuarios en lenguaje natural, el modelo de embedding convierte la consulta en una incrustación de vector y, a continuación, recupera datos similares de la base de conocimiento. El sistema de IA combina los datos recuperados con la consulta del usuario para generar una respuesta consciente del contexto.

¿Qué es la IA agéntica?

La IA agentiva es un tipo de IA que puede determinar y llevar a cabo un curso de acción por sí misma. La mayoría de los agentes disponibles en el momento de la publicación son LLM con capacidades de llamada a funciones, lo que significa que pueden llamar a herramientas para realizar tareas. En teoría, los agentes de IA son LLM con tres características importantes:

Tienen memoria, tanto a corto como a largo plazo, lo que les permite planificar y ejecutar tareas complejas. La memoria también permite a los agentes consultar tareas anteriores y utilizar esos datos para informar flujos de trabajo futuros. Los sistemas de RAG agentiva utilizan el almacenamiento en caché semántico para almacenar y hacer referencia a conjuntos anteriores de consultas, contexto y resultados.

Son capaces de enrutar consultas, planificar paso a paso y tomar decisiones. Los agentes utilizan sus capacidades de memoria para retener información y trazar un curso de acción apropiado en respuesta a consultas e instrucciones complejas.

Pueden realizar llamadas a herramientas a través de API. Los agentes más capaces pueden elegir qué herramientas utilizar para el flujo de trabajo que generan en respuesta a las interacciones de los usuarios.

Los flujos de trabajo de agentes pueden constar de un agente de IA o de sistemas multiagente que combinen varios agentes.

Boletín del sector

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

RAG agéntica vs. sistemas de RAG tradicional

La RAG agéntica aporta varias mejoras significativas sobre la implementación tradicional de RAG:

Flexibilidad: las aplicaciones de RAG agéntica extraen datos de varias bases de conocimiento externas y permiten el uso de herramientas externas. Los pipelines RAG estándar conectan un LLM a un único conjunto de datos externo. Por ejemplo, muchos sistemas RAG empresariales combinan un chatbot con una base de conocimientos que contiene datos de la organización.
Adaptabilidad: los sistemas de RAG tradicional son herramientas reactivas de recuperación de datos que encuentran información relevante en respuesta a consultas específicas. El sistema RAG no tiene capacidad para adaptarse a contextos cambiantes o acceder a otros datos. Los resultados óptimos a menudo requieren un prompt engineering extenso.

Mientras tanto, la RAG agéntica es una transición desde una consulta estática basada en reglas a una resolución de problemas inteligente y adaptativa. Los sistemas multiagente animan a varios modelos de IA a colaborar y comprobar el trabajo de los demás.
Precisión: los sistemas de RAG tradicional no validan ni optimizan sus propios resultados. Las personas deben discernir si el sistema está funcionando a un nivel aceptable. El sistema en sí no tiene forma de saber si está encontrando los datos correctos o incorporándolos con éxito para facilitar la generación consciente del contexto. Sin embargo, los agentes de IA pueden iterar sobre procesos anteriores para optimizar los resultados a lo largo del tiempo.
Escalabilidad: gracias a las redes de agentes del RAG que trabajan juntos, acceden a múltiples fuentes de datos externas y utilizan las capacidades de planificación y llamada de herramientas, la RAG agentiva tiene una mayor escalabilidad. Los desarrolladores pueden construir sistemas RAG flexibles y escalables que puedan manejar una amplia gama de consultas de usuarios.
Multimodalidad: los sistemas de RAG agéntica obtienen un beneficio de los recientes avances en LLM multimodales para trabajar con una mayor variedad de tipos de datos, como imágenes y archivos de audio. Los modelos multimodales procesan múltiples tipos de datos estructurados, semiestructurados y no estructurados. Por ejemplo, varios modelos GPT recientes pueden generar contenidos visuales y sonoros además de la generación de texto estándar.

Considere varios empleados trabajando en una oficina. Un sistema RAG tradicional es aquel en el que el empleado rinde bien cuando se le asignan tareas específicas y se le indica cómo llevarlas a cabo. Son reacios a tomar la iniciativa y se sienten incómodos al ir más allá de las instrucciones explícitas.

En comparación, un sistema de RAG agentiva es un equipo proactivo y creativo. También son buenos para seguir instrucciones, pero les encanta tomar la iniciativa y resolver desafíos por su cuenta. No tienen miedo de encontrar sus propias soluciones a tareas complejas que podrían desconcertar o intimidar a sus compañeros de trabajo.

¿Es la RAG agéntica mejor que la RAG tradicional?

Aunque la RAG agéntica optimiza los resultados con llamadas a funciones, razonamiento de varios pasos y sistemas multiagente, no siempre es la mejor opción. Más agentes trabajando significa mayores gastos, y un sistema de RAG agéntica suele requerir el pago de más tokens. Mientras que las RAG agénticas pueden acelerar el proceso en comparación con las RAG tradicionales, los LLM también introducen latencia, ya que el modelo puede tardar más en generar sus salidas.

Por último, los agentes no siempre son fiables. Pueden tener dificultades e incluso no completar las tareas, dependiendo de la complejidad y los agentes utilizados. Los agentes no siempre colaboran sin problemas y pueden competir por los recursos. Cuantos más agentes haya en un sistema, más compleja se vuelve la colaboración, con mayores posibilidades de complicaciones. Y ni siquiera el sistema de RAG más hermético puede eliminar por completo el potencial de alucinaciones.

AI Academy

Conviértase en un experto en IA

Obtenga los conocimientos necesarios para priorizar las inversiones en IA que impulsan el crecimiento empresarial. Dé sus primeros pasos hoy mismo con nuestra AI Academy gratuita y lidere el futuro de la IA en su organización.

Vea la serie

¿Cómo funciona la RAG agéntica?

La RAG agéntica funciona incorporando uno o más tipos de agentes de IA en los sistemas RAG. Por ejemplo, un sistema de RAG agéntica puede combinar varios agentes de recuperación de información, cada uno especializado en un dominio o tipo de fuente de datos determinado. Un agente busca en bases de datos externas mientras que otro puede revisar los correos electrónicos y los resultados de la web.

Los marcos de IA agéntica, como LangChain y LlamaIndex, y el marco de orquestación LangGraph se pueden encontrar en GitHub. Con ellos, es posible experimentar con arquitecturas agénticas para RAG a costes mínimos. Si utilizan modelos de código abierto como Graniteo Llama-3, los diseñadores de sistemas RAG también pueden mitigar las tarifas exigidas por otros proveedores como OpenAI mientras disfrutan de una mayor observabilidad.

Los sistemas de RAG agéntica pueden contener uno o más tipos de agentes de IA, como:

Agentes de enrutamiento

Agentes de planificación de consultas

Agentes de ReAct

Agentes de planificación y ejecución

Agentes de enrutamiento

Los agentes de enrutamiento determinan qué fuentes de conocimiento y herramientas externas se utilizan para abordar una consulta de usuario. Procesan las instrucciones de los usuarios e identifican la canalización RAG que tiene más probabilidades de dar lugar a una generación de respuestas óptima. En un sistema RAG de un solo agente, un agente de enrutamiento elige el origen de datos que desea consultar.

Agentes de planificación de consultas

Los agentes de planificación de consultas son los administradores de tareas del pipeline de RAG. Procesan consultas complejas de los usuarios para dividirlas en procesos paso a paso. Envían las subconsultas resultantes a los demás agentes del sistema RAG y, a continuación, combinan las respuestas para obtener una respuesta general cohesiva. El proceso de usar un agente para administrar otros modelos de IA es un tipo de orquestación de IA.

Agentes de ReAct

ReAct (razonamiento y acción) es un marco de agentes que crea sistemas multiagentes que pueden crear soluciones paso a paso y, a continuación, actuar sobre ellas. También pueden identificar las herramientas adecuadas que pueden ayudar. En función de los resultados de cada paso, los agentes de ReAct pueden ajustar de forma dinámica las siguientes etapas del flujo de trabajo generado.

Agentes de planificación y ejecución

Los marcos de agentes de planificación y ejecución son una progresión de los agentes ReAct. Pueden ejecutar flujos de trabajo de varios pasos sin volver a llamar al agente principal, lo que reduce los costes y aumenta la eficiencia. Y como el agente de planificación debe razonar a través de todos los pasos necesarios para una tarea, las tasas de finalización y la calidad tienden a ser más altas.

Casos de uso de RAG agéntica

Aunque la RAG agéntica puede adaptarse a cualquier aplicación de RAG tradicional, las mayores demandas de computación la hacen más apropiada para situaciones que requieren consultar múltiples fuentes de datos. Las aplicaciones de RAG agéntica incluyen:

Respuesta a preguntas en tiempo real: las empresas pueden implementar chatbots con tecnología RAG y preguntas frecuentes para proporcionar a los empleados y clientes información actualizada y precisa.

Asistencia automatizada: las empresas que desean optimizar los servicios de atención al cliente pueden utilizar sistemas de RAG automatizada para gestionar consultas de clientes más sencillas. El sistema de RAG agéntica puede escalar las solicitudes de soporte más exigentes al personal humano.

Gestión de datos: los sistemas RAG facilitan la búsqueda de información dentro de los almacenes de datos propietarios. Los empleados pueden obtener rápidamente los datos que necesitan sin tener que buscarlos ellos mismos en las bases de datos.

Comience a obtener ROI: una guía práctica para la IA agéntica

Descubra formas de avanzar y ampliar con éxito la IA en su empresa con resultados reales.

Recursos

Aumente la productividad con agentes de IA creados para su empresa

Explore el potencial innovador de los agentes de IA que pueden integrarse sin esfuerzo en sus operaciones comerciales.

Guía de compradores de agentes de IA 2025

Consulte esta completa guía que detalla los casos de uso clave, las capacidades principales y las recomendaciones paso a paso que le ayudarán a elegir las soluciones adecuadas para su empresa.

Reimagine business productivity with AI agents and assistants (Reinvente la productividad empresarial con agentes de IA y asistentes)

Descubra cómo los agentes de IA y asistentes de IA pueden trabajar juntos para alcanzar nuevos niveles de productividad.

Informe de Omdia sobre inteligencia potenciada: el impacto de los agentes de IA

Descubra cómo puede desbloquear todo el potencial de la IA generativa con agentes de IA.

Introducción a la empresa agéntica: poner la IA al servicio de toda su tecnología

Manténgase al día sobre los nuevos agentes de IA, un punto de inflexión fundamental en la revolución de la IA.

Pruebe watsonx Orchestrate

Explore cómo los asistentes de IA generativa pueden aligerar su carga de trabajo y mejorar la productividad.

How AI agents will reinvent productivity (Cómo los agentes de IA reinventarán la productividad)

Aprenda formas de utilizar la IA para ser más creativo y eficiente y empezar a adaptarse a un futuro que implica trabajar en estrecha colaboración con los agentes de IA.

El futuro de los agentes, el consumo de energía de la IA, el uso del ordenador de Anthropic y el texto generado por IA con marcas de agua de Google

Manténgase a la vanguardia con nuestros expertos en IA en este episodio de Mixture of Experts mientras profundizan en el futuro de los agentes de IA y más.

Cómo utiliza Comparus un "asistente bancario"

Comparus utilizó soluciones de IBM watsonx.ai y demostró de manera impresionante el potencial de la banca conversacional como un nuevo modelo de interacción.

Soluciones relacionadas

Agentes de IA para empresas

Cree, implemente y gestione potentes asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

Explore watsonx Orchestrate

Soluciones de agente de IA de IBM

Construya el futuro de su empresa con soluciones de IA en las que puede confiar.

Explore las soluciones de los agentes de IA

Servicios de IA de IBM Consulting

Los servicios de IA de IBM Consulting ayudan a reinventar la forma de trabajar de las empresas usando IA para la transformación.

Explore los servicios de inteligencia artificial

Dé el siguiente paso

Tanto si opta por personalizar las aplicaciones y habilidades prediseñadas como si prefiere crear e implementar servicios agentivos personalizados mediante un estudio de IA, la plataforma IBM watsonx le ofrece todo lo que necesita.