¿Qué es GraphRAG?

¿Qué es GraphRAG?

GraphRAG es una versión avanzada de la generación aumentada por recuperación (RAG) que incorpora datos estructurados por grafos, como los grafos de conocimiento (KG).1 A diferencia de los sistemas RAG básicos que se basan en la búsqueda vectorial para recuperar texto semánticamente similar, GraphRAG aprovecha la estructura relacional de los gráficos para recuperar y procesar información basada en consultas específicas del dominio. 

GraphRAG fue introducido por Microsoft Research en 2024 para abordar las limitaciones de los modelos de lenguaje de gran tamaño (LLM).2 Los LLM tradicionales suelen tener problemas con flujos de trabajo complejos, especialmente a la hora de razonar datos privados o estructurados, porque carecen de la capacidad de entender las relaciones entre las entidades. GraphRAG resuelve este problema utilizando bases de datos gráficas para modelar estas relaciones, lo que le permite gestionar consultas complejas, recuperar información contextual y mejorar la precisión en aplicaciones de IA generativa (IA generativa).

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

¿Cómo funciona GraphRAG?

La generación aumentada por recuperación (RAG) es una técnica que recupera información relevante mediante búsqueda de similitud a partir de bases de datos vectoriales, fuentes externas de conocimiento y bases de conocimiento internas. A continuación, combina la información recuperada con los LLM para generar outputs precisos y adaptados al contexto. Aunque las aplicaciones RAG tradicionales mejoran la funcionalidad de los LLM en aplicaciones de IA generativa, carecen de la capacidad de capturar relaciones de datos complejas en los datos. Le cuesta realizar tareas como el razonamiento multisalto (combinar información de múltiples fuentes para obtener respuestas a través de conexiones lógicas e inferencias indirectas), el contexto relacional y la comprensión de datos jerárquicos. Por ejemplo, un enfoque RAG tradicional podría tener problemas con una consulta como "¿Quién desarrolló la teoría de la relatividad?" porque requiere un razonamiento sobre las relaciones entre entidades. 

GraphRAG supera este problema incorporando datos estructurados por grafos, que organizan la información como una red de nodos (entidades como personas o lugares), edge (relaciones entre esas entidades) y etiquetas (atributos que definen la categoría de un nodo y el edge). Por ejemplo, un gráfico de conocimiento podría representar "Albert Einstein desarrolló la teoría de la relatividad". como piezas de información estructuradas por grafos, lo que facilita a GraphRAG la recuperación y el procesamiento de esta información. En este ejemplo, los nodos son "Albert Einstein" y "teoría de la relatividad", y el edge es "desarrollado".

Arquitectura GraphRAG

Componentes de GraphRAG

GraphRAG funciona a través de cuatro componentes principales:

  1. Procesador de consultas

  2. Recuperador

  3. Organizador

  4. Generador

Procesador de consultas

La consulta del usuario se preprocesa para identificar las entidades clave y las relaciones relevantes para la estructura del grafo. Se utilizan técnicas como el reconocimiento de entidades nombradas y la extracción relacional del machine learning para asignar la consulta a nodos y edges dentro del grafo. Por ejemplo, una consulta como "¿Quién desarrolló la teoría de la relatividad?" identifica a "Albert Einstein" como un nodo y "desarrolló" como la relación que se buscará en el grafo. Herramientas como Cypher, un lenguaje de consulta de grafos, se utilizan para obtener datos específicos de dominio a partir de grafos de conocimiento. 

Recuperador

El recuperador localiza y extrae contenido relevante de fuentes de datos gráficas externas en función de la consulta procesada. A diferencia de los sistemas RAG tradicionales que se basan en el embedding vectorial de texto o imágenes, los GraphRag recuperadores gestionan los datos estructurados en gráficos aprovechando las señales semánticas y estructurales. Utilizan técnicas como algoritmos de recorrido de gráficos (métodos como la búsqueda en amplitud (BFS) o la búsqueda en profundidad (DFS) que exploran el gráfico para localizar nodos y edges relevantes). Técnicas adicionales incluyen redes neuronales gráficas (GNN) (modelos de IA que aprenden la estructura de los grafos para recuperar datos de forma eficaz), recuperación adaptativa (ajusta dinámicamente cuánto del grafo se puede buscar, reduciendo información o ruido irrelevantes) y modelos de embedding. Para la consulta "¿Quién desarrolló la teoría de la relatividad?", el buscador localiza el nodo "teoría de la relatividad" en el grafo y sigue la relación "desarrollada por" para encontrar a "Albert Einstein".

Organizador

Los datos del grafo recuperados se refinan para eliminar la información irrelevante o ruidosa mediante técnicas como la poda, la reclasificación y el aumento de grafos. El organizador ayuda a garantizar que el gráfico recuperado esté limpio, compacto y listo para su procesamiento, al tiempo que conserva la información contextual crítica. Para la consulta "¿Quién desarrolló la teoría de la relatividad?" el organizador refina los datos del grafo recuperados eliminando nodos y aristas irrelevantes, lo que ayuda a garantizar que solo se conserve la relación relevante, "Albert Einstein (desarrolló) teoría de la relatividad". 

Generador

Los datos del grafo limpiados se utilizan entonces para producir el output final. Esto puede implicar generar respuestas basadas en texto mediante LLM o crear nuevas estructuras gráficas para tareas científicas, como el diseño de moléculas o la expansión de gráficos de conocimiento. Para la consulta "¿Quién desarrolló la teoría de la relatividad?", GraphRAG recupera "Albert Einstein" del grafo y genera la respuesta: "Albert Einstein desarrolló la teoría de la relatividad". Se utilizan técnicas de IA generativa para sintetizar la respuesta final. 

Ejemplo de GraphRAG

Aplicaciones de GraphRAG

GraphRAG es transformador en todos los sectores, combinando razonamiento basado en gráficos, búsqueda vectorial e IA generativa para manejar tareas específicas de dominio que exigen información contextual profunda. A continuación, exploramos algunas de las aplicaciones clave de GraphRAG:

  1. Resumen de texto centrado en consultas (QFS)

  2. Recomendaciones personalizadas

  3. Apoyo a la toma de decisiones

  4. Detección del fraude y prevención

  5. Gestión y recuperación del conocimiento

Resumen de texto centrado en consultas (QFS)

GraphRAG se puede utilizar para el resumen de texto centrado en consultas. Se centra en responder a consultas específicas de los usuarios recuperando y sintetizando información a partir de una representación del texto estructurada por gráficos. Un estudio demostró la eficacia de GraphRAG para responder preguntas exploratorias globales sobre grandes conjuntos de datos, como transcripciones de pódcasts y artículos de noticias.3  Superó a los sistemas RAG tradicionales basados en vectores en tareas que requerían conocimientos completos y diversos. Por ejemplo, GraphRAG se probó en un conjunto de datos de pódcast (~1 millón de tokens) con conversaciones con líderes tecnológicos y un conjunto de datos de noticias (~1,7 millones tokens) que cubren temas de estado, negocios y tecnología. Entre las preguntas figuraban "¿Cómo ven los líderes tecnológicos las leyes de privacidad?" y "¿Cuáles son las prioridades clave en materia de salud pública?". 

GraphRAG procesa estos conjuntos de datos construyendo un gráfico de conocimiento con entidades (por ejemplo, “leyes de privacidad”) y relaciones (por ejemplo, “impacto en la tecnología”), organizándolos en comunidades jerárquicas (grupo de nodos conectados que organizan temas de alto nivel en subtemas específicos). Los resúmenes comunitarios pregenerados permiten al sistema recuperar y combinar los conocimientos relevantes de manera eficiente. En comparación con el RAG tradicional, GraphRAG logró una mayor exhaustividad (72–83 %) y diversidad (62–82 %) en las respuestas generadas, aunque requirió hasta un 97 % menos de tokens para los resúmenes a nivel raíz. Esta capacidad convierte a GraphRAG en una herramienta ideal para tareas de comprensión en ámbitos como el periodismo, la educación y la investigación.

Recomendaciones personalizadas

En ámbitos como el comercio electrónico y el entretenimiento, GraphRAG permite que los chatbots y los motores de recomendación ofrezcan experiencias personalizadas. Por ejemplo, en el comercio electrónico, las interacciones pasadas entre usuarios y productos pueden formar un grafo. GraphRAG ayuda a gestionar el creciente volumen de datos de interacción de los usuarios mediante la extracción de subgrafos clave que revelan las preferencias y comportamientos de los usuarios. La investigación ha demostrado que el uso de varios recuperadores para extraer los subgrafos pertinentes mejora la predicción de las acciones del usuario, mientras que recuperar los subgrafos de números anteriores similares mejora la calidad de los sistemas de preguntas y respuestas del servicio de atención al cliente.4

Apoyo a la toma de decisiones

En el sector sanitario, GraphRAG ayuda a los médicos a diagnosticar a pacientes con síntomas complejos analizando las relaciones entre enfermedades, síntomas y tratamientos dentro de una base de datos gráfica. Recupera estudios médicos relevantes, informes de casos e información sobre fármacos para sugerir posibles diagnósticos, destacar opciones de tratamiento eficaces e incluso advertir de posibles interacciones entre medicamentos. Esta capacidad permite a los profesionales sanitarios tomar decisiones más informadas, reducir los errores de diagnóstico y ofrecer una atención personalizada a los pacientes.  

Por ejemplo, un estudio reciente introdujo MedGraphRAG, un marco diseñado para aplicaciones médicas.5 Organiza los datos médicos en tres niveles: datos privados de usuario (por ejemplo, informes médicos), literatura médica reciente revisada por pares y diccionarios médicos fundacionales, lo que ayuda a garantizar la precisión, la trazabilidad y la relevancia. Utilizando una estructura jerárquica de grafos y una estrategia de "U-retrieve", recupera y sintetiza de forma eficiente la información para las consultas de los usuarios, mejorando el rendimiento de los LLM al generar respuestas fiables y basadas en evidencias con citas de fuente. Este marco demuestra el potencial para flujos de trabajo clínicos seguros, transparentes y eficientes, ayudando a los profesionales sanitarios con conocimientos que se pueden ejecutar.

Detección y prevención de fraudes

GraphRAG identifica patrones inusuales que se desvían del comportamiento esperado. Por ejemplo, en los servicios financieros, puede detectar patrones de transacciones sospechosas para prevenir el fraude o descubrir oportunidades de venta cruzada analizando el comportamiento de los clientes. Al conectar varias transacciones pequeñas entre cuentas, GraphRAG puede revelar esquemas fraudulentos más grandes, lo que ayuda a los bancos a mejorar la gestión de riesgos y proporcionar servicios más personalizados. 

Gestión y recuperación del conocimiento

GraphRAG puede mejorar la gestión del conocimiento organizando y recuperando documentos de manera que el conocimiento sea más accesible y adaptado a consultas específicas. Analiza el contexto y las relaciones entre varios documentos y ayuda a extraer la información más relevante de forma rápida y eficaz. Por ejemplo, un caso de uso destacado de GraphRAG es en los bufetes de abogados, donde sobresale en la gestión de vastas colecciones de documentos legales. Al analizar las relaciones y el contexto dentro de miles de documentos legales, GraphRAG puede recuperar de manera eficiente precedentes de casos relevantes o referencias legales, agilizando los flujos de trabajo de investigación y mejorando significativamente la precisión.

AI Academy

El auge de la IA generativa para empresas

Conozca el auge histórico de la IA generativa y lo que significa para las empresas.

Desafíos de GraphRAG

Los sistemas GraphRag presentan desafíos, como gestionar relaciones de datos complejas, ayudar a garantizar una recuperación eficaz y la integración con los modelos lingüísticos. Estos desafíos pueden abordarse mediante un cuidadoso diseño de esquemas gráficos, estrategias de consulta optimizadas y el aprovechamiento de herramientas sólidas. Los principales desafíos asociados con GraphRAG son:

  1. Escalabilidad

  2. Simplificación de la integración de componentes

  3. Fiabilidad

  4. Privacidad y seguridad

  5. Explainability

Escalabilidad

A medida que aumenta el volumen de datos, es difícil escalar los sistemas GraphRAG. Los desafíos incluyen la gestión de datos no estructurados, el almacenamiento eficiente de grafos, la optimización de consultas de grafos, el muestreo de subgrafos, la generación responsiva, la organización de componentes recuperados, el entrenamiento y el ajuste. La implementación de soluciones de hardware avanzadas, como la aceleración de GPU, la compresión de modelos y el mantenimiento, añade una mayor complejidad.

Optimización de la integración de componentes

El diseño de un sistema GraphRAG cohesivo requiere una interacción fluida entre los componentes del procesador de consultas, el recuperador, el organizador y el generador. Garantizar que estos componentes funcionen armoniosamente manteniendo la eficiencia y la precisión es un desafío complejo.

Fiabilidad

Garantizar tasas de error bajas en el razonamiento multipaso es todo un reto debido a la acumulación de errores en la recuperación y la generación multihop.

Privacidad y seguridad

La estructura relacional de los gráficos introduce riesgos significativos de fuga de información confidencial, ya que las conexiones y los patrones dentro del gráfico pueden revelar datos privados. Proteger dicha información en todo el proceso de GraphRAG requiere técnicas sólidas de preservación de la privacidad. Los sistemas GraphRAG son susceptibles a ataques adversarios, incluida la explotación de estructuras gráficas y la manipulación de instrucciones, lo que enfatiza aún más la necesidad de mejorar las medidas de seguridad.

Explicabilidad

Aunque GraphRAG ofrece una mayor explicabilidad a través de relaciones explícitas entre nodos, generar rutas de razonamiento o explicaciones claras e interpretables sigue siendo un desafío. Garantizar que estas explicaciones sean completas y fieles a la lógica del sistema es crítico para la confianza en ámbitos de alto riesgo como la sanidad, el derecho y las finanzas.

Marcos para construir un sistema GraphRAG

Los sistemas GraphRAG se pueden implementar mediante el uso de diversas herramientas y marcos, incluidas las opciones de código abierto, para respaldar el procesamiento de documentos, la creación de gráficos de conocimiento, la búsqueda semántica y la integración de LLM. Entre las herramientas más populares se encuentran LangChain, LlamaIndex, Neo4j y OpenAI, y en plataformas como GitHub hay recursos y tutoriales adicionales disponibles. 

LlamaIndex se utiliza para indexar documentos, extraer entidades y relaciones para crear gráficos de conocimiento, generar embeddings vectoriales e integrarse con LLM como GPT. Neo4j sirve como base de datos para almacenar y gestionar estructuras de grafos, lo que permite una recuperación eficaz mediante el recorrido de los grafos y las relaciones semánticas. 

Estas herramientas trabajan juntas para permitir la búsqueda semántica mediante el uso de embeddings vectoriales, el manejo de metadatos para la transparencia y la generación de respuestas sensibles al contexto. Los LLM, incluidos los modelos OpenAI GPT, integrados a través de API, ayudan a producir respuestas precisas y relevantes basadas en los datos gráficos recuperados. 

GraphRAG supone un gran avance respecto a los sistemas RAG tradicionales, que están limitados por métodos de recuperación lineal. Combina el poder de los gráficos de conocimiento, la búsqueda semántica y los modelos de lenguaje avanzados. A medida que los sectores exigen una comprensión más profunda y conocimientos interconectados, GraphRAG se convertirá en una tecnología clave. Permitirá disponer de sistemas de información más inteligentes, dinámicos y altamente adaptables en el futuro.

AI Academy

El auge de la IA generativa para empresas

Conozca el auge histórico de la IA generativa y lo que significa para las empresas.

Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA
Servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.

Explore watsonx.ai Solicite una demostración en directo
Notas a pie de página

1 Han, H., Wang, Y., Shomer, H., Guo, K., Ding, J., Lei, Y., ... & Tang, J. (2024). Generación aumentada por recuperación con gráficos (graphrag). arXiv preprint arXiv:2501.00309.

2 Larson, J., & Truitt, S. (2024). GraphRAG: desbloquear el descubrimiento LLM en datos privados narrativos. Blog de Microsoft Research. https://www.microsoft.com/es-es/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/

3 Edge, D., Trinh, H., Cheng, N., Bradley, J., Chao, A., Mody, A., ... & Larson, J. (2024). De lo local a lo global: un enfoque basado en grafos para la integración centrada en consultas. arXiv preprint arXiv:2404.16130.

4 Peng, B., Zhu, Y., Liu, Y., Bo, X., Shi, H., Hong, C., ... & Tang, S. (2024). Generación aumentada por recuperación: una encuesta. arXiv preprint arXiv:2408.08921.

5 Wu, J., Zhu, J., Qi, Y., Chen, J., Xu, M., Menolascina, F., & Grau, V. (2024). Gráfico médico: hacia un modelo médico seguro de lenguaje de gran tamaño mediante generación aumentada por recuperación. arXiv preprint arXiv:2408.04187.