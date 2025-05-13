La generación aumentada por recuperación (RAG, por sus siglas en inglés) es una técnica que recupera información relevante mediante búsqueda de similitud a partir de bases de datos vectoriales, fuentes externas de conocimiento y bases de conocimiento internas. Luego combina esta información recuperada con LLM para generar resultados precisos y conscientes del contexto. Si bien las aplicaciones RAG tradicionales mejoran la funcionalidad de los LLM en aplicaciones de IA generativa, carecen de la capacidad de capturar relaciones de datos complejas en los datos. Le cuesta realizar tareas como el razonamiento multihop (combinar información de múltiples fuentes para obtener respuestas a través de conexiones lógicas e inferencias indirectas), el contexto relacional y la comprensión de datos jerárquicos. Por ejemplo, un enfoque RAG tradicional podría tener dificultades con una consulta como "¿Quién desarrolló la teoría de la relatividad?" porque requiere un razonamiento sobre las relaciones entre entidades.

GraphRAG supera este problema incorporando datos estructurados en grafos, que organizan la información como una red de nodos (entidades como personas o lugares), bordes (relaciones entre esas entidades) y etiquetas (atributos que definen la categoría de un nodo y un borde). Por ejemplo, un gráfico de conocimiento podría representar "Albert Einstein desarrolló la teoría de la relatividad" como fragmentos de información estructurados en gráficos, lo que facilita que GraphRAG recupere y procese esta información. En este ejemplo, los nodos son "Albert Einstein" y "teoría de la relatividad", y el borde es "desarrolló".