¿Qué es RAG agéntica?

Autores

Staff writer

Staff Editor, AI Models

IBM Think

RAG agéntica se refiere al uso de agentes de IA para facilitar la generación aumentada por recuperación (RAG). Los sistemas de RAG agéntica agregan agentes de IA al pipeline de RAG para mejorar la adaptabilidad y la precisión. En comparación con los sistemas de RAG tradicionales, la RAG agéntica permite que los modelos de lenguaje extensos (LLM) lleven a cabo la recuperación de información de múltiples fuentes y se ocupen de flujos de trabajo más complejos.

¿Qué es RAG?

La generación aumentada por recuperación es una aplicación de la inteligencia artificial (IA) que conecta un modelo de IA generativa con una base de conocimiento externa. Los datos de la base de conocimiento refuerzan las consultas de los usuarios con más contexto para que el LLM pueda generar respuestas más precisas. La RAG permite que los LLM sean más precisos en contextos de un dominio específico sin necesidad de hacer ajuste fino.

En lugar de depender únicamente de los datos de entrenamiento, los modelos de IA habilitados por RAG pueden acceder a los datos actuales en tiempo real a través de las API y otras conexiones a fuentes de datos. Un pipeline estándar de RAG consta de dos modelos de IA:

El componente de recuperación de información, normalmente un modelo de incorporación en combinación con una base de datos vectorial que contiene los datos que se van a recuperar.

El componente de IA generativa, generalmente un LLM.

En respuesta a las consultas de los usuarios en lenguaje natural, el modelo de incorporación convierte la consulta en una incorporación vectorial y, a continuación, recupera datos similares de la base de conocimiento. El sistema de IA combina los datos recuperados con la consulta del usuario para generar una respuesta basada en la conciencia contextual.

¿Qué es IA agéntica?

La IA agéntica es un tipo de IA que puede determinar y llevar a cabo un curso de acción por sí misma. La mayoría de los agentes disponibles al momento de la publicación son LLM con capacidades de llamada de funciones, lo que significa que pueden recurrir a herramientas para realizar tareas. En teoría, los agentes de IA son LLM con tres características importantes:

Tienen memoria, tanto a corto como a largo plazo, lo que les permite planificar y ejecutar tareas complejas. La memoria también permite a los agentes consultar tareas anteriores y utilizar esos datos para fundamentar flujos de trabajo futuros. Los sistemas de RAG agéntica utilizan el almacenamiento en caché semántico para almacenar y consultar conjuntos anteriores de consultas, contexto y resultados.

Son capaces de enrutar consultas, planificar paso a paso y tomar decisiones. Los agentes utilizan sus capacidades de memoria para retener información y trazar un curso de acción adecuado en respuesta a consultas e instrucciones complejas.

Pueden realizar llamadas de herramientas a través de API. Los agentes más capaces pueden elegir qué herramientas usar para el flujo de trabajo que generan en respuesta a las interacciones del usuario.

Los flujos de trabajo agénticos pueden constar de un agente de IA o de sistemas multiagente que combinan varios agentes.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

Sistemas de RAG agéntica frente a sistemas de RAG tradicional

La RAG agéntica aporta varias mejoras significativas con respecto a la implementación tradicional de la RAG:

Flexibilidad: las aplicaciones de RAG agéntica extraen datos de múltiples bases de conocimiento externas y permiten el uso de herramientas externas. Los pipelines estándar de RAG conectan un LLM a un solo conjunto de datos externo. Por ejemplo, muchos sistemas de RAG empresariales combinan un chatbot con una base de conocimiento que contiene datos propiedad de la organización.
Adaptabilidad: los sistemas de RAG tradicionales son herramientas de recuperación de datos reactivas que encuentran información relevante en respuesta a consultas específicas. El sistema RAG no tiene capacidad para adaptarse a contextos cambiantes ni para acceder a otros datos. Los resultados óptimos a menudo requieren una extensa ingeniería rápida.

Mientras tanto, la RAG agéntica es la transición de una consulta estática basada en reglas a una resolución de problemas inteligente y adaptativa. Los sistemas multiagente alientan a varios modelos de IA a colaborar y a verificar su trabajo entre sí.
Precisión: los sistemas RAG tradicionales no validan ni optimizan sus propios resultados. Las personas deben discernir si el sistema está funcionando a un nivel aceptable. El sistema por sí mismo no tiene forma de saber si está encontrando los datos correctos o incorporándolos exitosamente para facilitar la generación con conciencia contextual. Sin embargo, los agentes de IA pueden iterar en procesos anteriores para optimizar los resultados con el tiempo.
Escalabilidad: gracias a redes de agentes de RAG trabajando en conjunto, aprovechando múltiples fuentes de datos externas y utilizando capacidades de planificación y llamada de herramientas, la RAG agéntica tiene mayor escalabilidad. Los desarrolladores pueden construir sistemas de RAG flexibles y escalables que pueden ocuparse de una amplia gama de consultas de los usuarios.
Multimodalidad: los sistemas de RAG agéntica se benefician de los avances recientes en los LLM multimodales para trabajar con una mayor variedad de tipos de datos, como imágenes y archivos de audio. Los modelos multimodales procesan múltiples tipos de datos estructurados, semiestructurados y no estructurados. Por ejemplo, varios modelos GPT recientes pueden generar contenido visual y de audio además de texto estándar.

Piense en varios empleados de una oficina. Un sistema de RAG tradicional sería el empleado que se desempeña bien cuando se le dan tareas específicas y se le dice cómo realizarlas. Se muestran reacios a tomar la iniciativa y se sienten incómodos al salirse de las instrucciones explícitas.

En comparación, un sistema de RAG agéntica sería un equipo proactivo y creativo. Sus miembros también siguen instrucciones perfectamente, pero les encanta tomar la iniciativa y resolver los retos por sí mismos. No temen proponer sus propias soluciones a tareas complejas que podrían dejar perplejos o intimidar a sus colegas.

¿La RAG agéntica es mejor que la RAG tradicional?

Si bien la RAG agéntica optimiza los resultados con llamadas de funciones, razonamiento de múltiples pasos y sistemas multiagente, no siempre es la mejor opción. Un mayor número de agentes en el trabajo se traduce en mayores gastos, y un sistema de RAG agéntica normalmente requiere que se pague por más tokens. Mientras que la RAG agéntica puede aumentar la velocidad en comparación con la RAG tradicional, los LLMs también introducen latencia porque el modelo puede tardar más tiempo en generar sus salidas.

Por último, los agentes no siempre son fiables. Es posible que tengan dificultades e incluso no logren completar las tareas, dependiendo de la complejidad y los agentes empleados. Los agentes no siempre colaboran sin problemas y pueden competir por los recursos. Cuantos más agentes haya en un sistema, más compleja se vuelve la colaboración, así como aumentan las probabilidades de que se presenten complicaciones. Y aun el sistema RAG más hermético no puede eliminar por completo el potencial de alucinaciones.

AI Academy

Conviértase en un experto en IA

Obtenga el conocimiento para priorizar las inversiones en IA que impulsan el crecimiento del negocio. Comience hoy mismo con nuestra AI Academy gratuita y lidere el futuro de la IA en su organización.

Ver la serie

¿Cómo funciona la RAG agéntica?

La RAG agéntica incorpora uno o más tipos de agentes de IA en sistemas de RAG. Por ejemplo, un sistema de RAG agéntica podría combinar varios agentes de recuperación de información, cada uno especializado en un determinado dominio o tipo de fuente de datos. Un agente busca en bases de datos externas y otro revisa correos electrónicos y resultados de la web.

Los marcos de IA agéntica, tales como LangChain y LlamaIndex, y el marco de orquestación LangGraph se pueden encontrar en GitHub. Con ellos, es posible experimentar con arquitecturas agénticas para RAG por costos mínimos. Si utilizan modelos de código abierto, como Graniteo Llama-3, los diseñadores de sistemas de RAG también pueden aminorar las tarifas que exigen otros proveedores como OpenAI mientras disfrutan de una mayor observabilidad.

Los sistemas de RAG agéntica pueden contener uno o más tipos de agentes de IA, como:

Agentes de enrutamiento

Agentes de planificación de consultas

Agentes ReAct

Agentes de planificación y ejecución

Agentes de enrutamiento

Los agentes de enrutamiento determinan qué fuentes y herramientas de conocimiento externas se utilizan para atender la consulta de un usuario. Procesan las instrucciones de los usuarios e identifican el pipeline de RAG con mayor probabilidad de generar una respuesta óptima. En un sistema de RAG de agente único, un agente de enrutamiento elige qué fuente de datos consultar.

Agentes de planificación de consultas

Los agentes de planificación de consultas son los administradores de tareas del pipeline de la RAG. Procesan consultas complejas de los usuarios para dividirlas en procesos paso a paso. Envían las subconsultas resultantes a los otros agentes del sistema de RAG y luego combinan las respuestas para obtener una respuesta general cohesiva. El proceso de utilizar un agente para gestionar otros modelos de IA es un tipo de orquestación de IA.

Agentes ReAct

ReAct (razonamiento y acción) es un marco de agentes que crea sistemas multiagente que pueden crear soluciones paso a paso y luego llevarlas a cabo. También pueden identificar herramientas útiles pertinentes. Con base en los resultados de cada paso, los agentes ReAct pueden ajustar dinámicamente las etapas posteriores del flujo de trabajo generado.

Agentes de planificación y ejecución

Los marcos de agentes de planificación y ejecución son una progresión de los agentes ReAct. Pueden ejecutar flujos de trabajo de varios pasos sin llamar de nuevo al agente principal, reduciendo así los costos y aumentando la eficiencia. Y dado que el agente de planificación debe razonar todos los pasos necesarios para una tarea, las tasas de finalización y la calidad tienden a ser más altas.

Casos de uso de la RAG agéntica

Si bien la RAG agéntica puede funcionar para cualquier aplicación de RAG tradicional, la mayor demanda computacional la hace más apropiada para situaciones que requieren consultar múltiples fuentes de datos. Las aplicaciones de la RAG agéntica incluyen:

Respuesta a preguntas en tiempo real: las empresas pueden desplegar chatbots impulsados por RAG y preguntas frecuentes para proporcionar a empleados y clientes información actualizada y precisa.

Asistencia automatizada: las empresas que deseen agilizar los servicios de soporte técnico pueden emplear sistemas de RAG automatizados para ocuparse de consultas más sencillas de los clientes. El sistema de RAG agéntica puede derivar solicitudes de soporte más exigentes a personal humano.

Gestión de datos: los sistemas de RAG facilitan la búsqueda de información dentro de los almacenes de datos de propiedad exclusiva. Los empleados pueden obtener rápidamente la información que necesitan sin tener que revisar las bases de datos ellos mismos.

Comience a obtener el retorno de la inversión (ROI): una guía práctica para la IA agéntica

Aprenda a escalar la IA agéntica para obtener un retorno de la inversión (ROI) medible en toda su empresa. Este playbook describe las principales barreras que limitan el impacto, cómo medir eficazmente el ROI y un marco práctico para impulsar una adopción exitosa en toda la empresa.

Recursos

La empresa en 2030: diseñada para la innovación perpetua

Descubra nuestras cinco predicciones sobre lo que definirá a las empresas más exitosas en 2030 y las medidas que los líderes pueden tomar para obtener una ventaja que prioriza la IA.

El imperativo de la gobernanza de la IA: regulaciones en evolución y aparición de la IA agéntica

Descubra cómo la evolución de las regulaciones y la aparición de los agentes de IA están transformando la necesidad de contar con infraestructuras sólidas de gobernanza de la IA.

Explicación de la IA agéntica

Techsplainers de IBM desglosa los aspectos esenciales de la IA agéntica, desde conceptos clave hasta casos de uso del mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

Desbloquee el retorno de la inversión (ROI) de la IA: una guía táctica para la productividad empresarial

Aprenda estrategias comprobadas para impulsar la productividad y potenciar la transformación empresarial con IA e innovación en el núcleo.

Cómo los agentes de IA y asistentes pueden beneficiar a su organización

Sumérjase en esta guía completa que desglosa los casos de uso clave y las capacidades principales, además de proporcionar recomendaciones paso a paso para ayudarle a elegir las soluciones adecuadas para su negocio.

Reinvente la productividad empresarial con agentes y asistentes de IA

Descubra cómo los agentes y asistentes de IA pueden trabajar juntos para alcanzar nuevos niveles de productividad.

Pruebe watsonx Orchestrate

Explore cómo los asistentes de IA generativa pueden aligerar su carga de trabajo y mejorar la productividad.

De los proyectos de IA a los beneficios: Cómo la IA agéntica puede mantener la rentabilidad financiera

Descubra cómo las organizaciones están pasando de lanzar IA en pilotos Dispar a usarla para impulsar la Transformación en el núcleo.

Informe de Omdia sobre inteligencia potenciada: el impacto de los agentes de IA

Descubra cómo puede desbloquear todo el potencial de la IA generativa con agentes de IA.

Cómo los agentes de IA reinventarán la productividad

Aprenda formas de utilizar la IA para tener más creatividad y eficiencia, y comenzar a adaptarse a un futuro que implica trabajar en estrecha colaboración con los agentes de IA.

El comienzo de la empresa agéntica: poner la IA a trabajar en todo su patrimonio tecnológico

Manténgase actualizado sobre los nuevos agentes de IA emergentes, un punto de inflexión fundamental en la revolución de la IA.

El futuro de los agentes, el consumo de energía de la IA, el uso informático de Anthropic y el texto generado por IA con marcas de agua de Google

Manténgase a la vanguardia con nuestros expertos en IA en este episodio de Mixture of Experts mientras investigan a profundidad el futuro de los agentes de IA y otros temas.

Cómo Comparus utiliza un "asistente bancario"

Comparus utilizó soluciones de watsonx.ai y demostró de manera impresionante el potencial de la banca conversacional como un nuevo modelo de interacción.

Soluciones relacionadas

Agentes de IA para empresas

Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

Explore watsonx Orchestrate

Soluciones de agentes de IA de IBM

Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.

Explorar las soluciones de agentes de IA

Servicios de IA de IBM Consulting

Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

Explorar los servicios de inteligencia artificial

Dé el siguiente paso

Ya sea que elija personalizar aplicaciones y habilidades predefinidas o crear y desplegar servicios agénticos personalizados utilizando un estudio de IA, la plataforma IBM watsonx responde a sus necesidades.