什么是 GraphRAG?

什么是 GraphRAG?

GraphRAG 是检索增强生成 (RAG) 的高级版本,它包含图形结构数据,例如知识图 (KG)。1 与依赖矢量搜索来检索语义相似文本的基线 RAG 系统不同,GraphRAG 充分利用图形的关系结构来检索,并根据特定领域的查询处理信息。

GraphRAG 由微软研究院于 2024 年推出,旨在解决大型语言模型 (LLM) 的局限性。2传统 LLM 往往在难以处理复杂的工作流,尤其是在私有或结构化数据推理方面,因为它们缺乏理解实体之间关系的能力。GraphRAG 通过使用图形数据库对这些关系进行建模,来解决这个问题,使其能够处理复杂的查询、检索上下文信息,并提高生成式 AI 应用程序的准确性。

GraphRAG 是如何工作的?

检索增强生成 (RAG) 是一种利用相似性搜索从矢量数据库、外部知识源和内部知识库中检索相关信息的技术。然后,它将检索到的信息与 LLM 相结合,生成准确且具有上下文感知功能的输出。虽然传统的 RAG 应用程序增强了生成式 AI 应用程序中 LLM 的功能,但它缺乏捕获数据中复杂数据关系的能力。它在执行多跳推理(组合来自多个来源的信息,从而通过逻辑连接和间接推理得出答案)、关系上下文和理解分层数据等任务方面遇到困难。例如,传统的 RAG 方法在面对“谁提出了相对论?”这样的查询时可能会遇到困难,因为它需要对实体之间的关系进行推理。

GraphRAG 通过整合图结构数据克服了这个问题,将信息组织为由节点(人物或地点等实体)、边缘(这些实体之间的关系)和标签(定义节点和边缘类别的属性)组成的网络。例如,知识图可能会将“阿尔伯特·爱因斯坦 - 提出的 - 相对论”表示为图形结构的信息,使 GraphRAG 更容易检索和处理这些信息。在此示例中,节点是“阿尔伯特 爱因斯坦”和“相对论”,边缘为“已提出”。

GraphRAG 架构

GraphRAG 的组件

GraphRAG 通过四个主要组件运行:

  1. 查询处理器

  2. 检索器

  3. 组织器

  4. 生成器

查询处理器

对用户的查询进行预处理,以识别与图形结构相关的关键实体和关系。系统使用机器学习中的命名实体识别 (NER) 和关系提取等技术,将查询映射到图表中的节点和边缘。例如,像“谁提出了相对论?”这样的查询将“阿尔伯特·爱因斯坦”标识为节点,并将“已提出”标识为图中要搜索的关系。诸如 Cypher(一种图形查询语言)等工具可用于从知识图中获取特定领域的数据。

检索器

检索器根据处理后的查询,从外部图形数据源中查找并提取相关内容。与依赖文本或图像矢量嵌入的传统 RAG 系统不同,GraphRAG 检索器利用语义和结构信号来处理图形结构数据。它们使用诸如图形遍历算法(广度优先搜索 (BFS) 或深度优先搜索 (DFS) 等方法,深入了解图形以定位相关节点和边缘)的技术。其他技术包括神经网络(学习图形结构以有效检索数据的 AI 模型)、自适应检索(动态调整要搜索的图形范围,减少不相关信息或噪声)和嵌入模型。对于查询“谁提出了相对论?”,检索器在图中找到节点“相对论”,并按照“由......提出”的关系找到“阿尔伯特·爱因斯坦”。

组织器

通过图形修剪、重新排序和增强等技术去除不相关或嘈杂的信息。组织器有助于确保检索到的图表干净、紧凑且适合处理,同时保留关键的上下文信息。对于查询“谁提出了相对论?”,组织器通过移除无关的节点和边缘来完善检索到的图形数据,帮助确保只保留相关的关系,即“阿尔伯特·爱因斯坦 - 提出 - 相对论。“

生成器

清理后的图数据随后生成最终输出。这可能涉及使用 LLM 生成基于文本的回答,或为科学任务(如分子设计或知识图谱扩展)创建新的图结构。对于查询“谁提出了相对论?”,GraphRAG 从图表中检索“阿尔伯特·爱因斯坦”并生成答案:“阿尔伯特·爱因斯坦提出了相对论”。生成式 AI 技术被用于合成最终回复。

GraphRAG 示例

GraphRAG 的应用

GraphRAG 在各个行业都具有变革性,它结合了基于图形的推理、矢量搜索和生成式 AI,来处理需要深度上下文信息的特定领域任务。下面我们将深入了解 GraphRAG 的一些关键应用:

  1. 以查询为中心的文本摘要 (QFS)

  2. 个性化推荐

  3. 决策支持

  4. 欺诈检测与预防

  5. 知识管理与检索

以查询为中心的文本摘要(QFS)

GraphRAG 可用于以查询为中心的文本摘要。它专注于通过从文本的图形结构表示中检索和合成信息来回答特定的用户查询。一项研究表明,GraphRAG 在回答大型数据集(如播客文字记录和新闻文章)上的全局性、探索性问题方面非常有效。3在需要全面且多样化洞察分析的任务中,它的表现优于基于矢量的传统 RAG 系统。例如,GraphRAG 在一个包含科技领袖对话的播客数据集(约 100 万令牌)和一个涵盖健康、商业及技术主题的新闻数据集(约 170 万令牌)上进行了测试。问题包括“科技领袖如何看待隐私法律?” 以及“关键公共卫生优先事项是什么?”

GraphRAG 通过构建包含实体(例如,“隐私法”)和关系(例如,“对科技的影响”)的知识图谱来处理这些数据集,并将它们组织成层级化社区(一组连接节点,将高级主题组织到特定的子主题)。预先生成的社区摘要使系统能够有效地检索和组合相关的洞察分析。与传统 RAG 相比,GraphRAG 在生成答案中实现了更高的全面性 (72-83%) 和多样性 (62-82%),同时根级摘要所需的令牌减少了 97%。这种能力使 GraphRAG 成为新闻、教育和研究等领域执行有意义的构建任务的理想工具。

个性化推荐

在电子商务和娱乐等领域,GraphRAG 支持聊天机器人和推荐引擎提供个性化体验。例如,在电子商务中,用户与产品之间的过去交互可以形成一个图表。GraphRAG 通过提取揭示用户偏好和行为的关键子图,帮助管理不断增长的用户交互数据。研究表明,使用多个检索器提取相关子图可以增强用户操作预测,而检索过去类似问题的子图可以提高客户服务问答系统的质量。4

决策支持

在医疗保健领域,GraphRAG 通过分析图形数据库中疾病、症状和治疗之间的关系,协助医生对具有复杂症状的患者进行诊断。它检索相关的医学研究、病例报告和药物信息,以提出可能的诊断建议,突显有效的治疗方案,甚至警告潜在的药物相互作用。这一功能使医疗专业人员能够做出更明智的决策,减少诊断错误,并为患者提供个性化护理。

例如,最近的一项研究推出了 MedGraphRAG,这是一个专为医疗应用程序而设计的框架。5它将医疗数据组织为三个层次:私人用户数据(例如医疗报告)、最新的同行评论医学文献和基础医学词典,帮助确保准确性、可追溯性和相关性。使用分层图结构和 U 型检索战略,高效地检索和综合用户查询信息,通过使用来源引用生成可靠的、基于证据的回复来提高 LLM 的性能。该框架展示了安全、透明和高效的临床工作流的潜力,为医疗保健专业人员提供有依据、可操作的洞察分析。

欺诈检测和预防

GraphRAG 能够识别偏离预期行为的异常模式。例如,在金融服务中,它可以检测可以通过分析客户行为来检测可疑交易模式以防止欺诈,或发现交叉销售的机会。通过连接跨账户的多笔小额交易,GraphRAG 可以揭示更大的欺诈阴谋,帮助银行加强风险管理,并提供更加个性化的服务。

知识管理与检索

GraphRAG 可以通过以一种使知识更易于访问并针对特定查询定制的方式来组织和检索文档,从而增强知识管理。它可以分析各种文档之间的上下文和关系,并帮助快速有效地提取最相关的信息。例如,GraphRAG 的一个重要用例是律师事务所,它擅长管理海量法律文档。通过分析数千份法律文件中的关系和上下文,GraphRAG 可以高效地检索相关判例或法律参考资料,从而简化研究工作流并显著提高准确性。

AI 学院

面向企业的生成式 AI 的兴起

了解生成式 AI 的历史兴起及其对企业的意义。

GraphRAG 的挑战

GraphRAG 系统带来了诸多挑战,例如管理复杂的数据关系、帮助确保高效检索以及与语言模型集成等。这些挑战可以通过精心设计图模式、优化查询战略和利用强大工具来解决。GraphRAG 面临的主要挑战包括:

  1. 可扩展性

  2. 简化组件集成

  3. 可靠性

  4. 隐私和安全

  5. 可解释性

可扩展性

随着数据量的增加,扩展 GraphRAG 系统变得非常困难。挑战包括管理非结构化数据、高效的图形存储、优化图形查询、子图采样、响应式生成、组织检索的组件、训练和微调。实施先进的硬件解决方案,如 GPU 加速、模型压缩和维护,进一步增加了复杂性。

简化组件集成

设计具有内聚性的 GraphRAG 系统需要在查询处理器、检索器、组织器和生成器组件之间进行无缝交互。确保这些组件在保持效率和准确性的同时协调运行是一项复杂的挑战。

可靠性

由于多跳检索和生成过程中错误的累积,确保多步推理的低错误率具有挑战性。

隐私与安全

图的关系结构引入了敏感信息泄露的重大风险,因为图中的连接和模式可能会泄露隐私数据。在整个 GraphRAG 管道中保护此类信息需要强大的隐私保护技术。GraphRAG 系统容易受到对抗性攻击,包括利用图结构和操纵提示,这进一步凸显了加强安全措施的必要性。

可解释性

虽然 GraphRAG 通过节点之间的明确关系提供了增强的可解释性,但生成清晰、可解释的推理路径或解释仍然是一个挑战。确保这些解释既全面又符合系统逻辑,对于医疗保健、法律和金融等高风险领域的信任至关重要。

构建 GraphRAG 系统的框架

GraphRag 系统可以通过使用各种工具和框架来实现,包括开源选项,以支持文档处理、知识图谱创建、语义搜索和 LLM 整合。热门工具包括 LangChainLlamaindex、Neo4j 和 OpenAI,并在 GitHub 等平台上提供了额外的资源和教程

Llama Index 用于索引文档、提取实体和关系以创建知识图谱、生成矢量嵌入并与诸如 GPT 等 LLM 集成。Neo4j 作为存储和管理图形结构的数据库,通过图形遍历和语义关系实现高效检索。

这些工具协同工作,通过使用矢量嵌入、元数据处理实现语义搜索,以实现透明度并生成上下文感知的回复。包括 OpenAI GPT 模型在内的 LLM 可通过 API 进行集成,有助于根据检索到的图形数据生成准确且相关的答案。

GraphRAG 是相较于传统 RAG 系统迈出的一大步,后者受线性检索方法的限制。它结合了知识图谱、语义搜索和高级语言模型的强大功能。随着各行各业需要更深入的理解和互连洞察分析,GraphRAG 势必成为一项关键技术。它将在未来实现更智能、更动态和高度自适应的信息系统。

AI 学院

面向企业的生成式 AI 的兴起

了解生成式 AI 的历史兴起及其对企业的意义。

相关解决方案
IBM watsonx.ai

使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai,可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据,即可在很短的时间内构建 AI 应用程序。

了解 watsonx.ai
人工智能 (AI) 解决方案

借助 IBM 业界领先的人工智能专业知识和解决方案组合,让人工智能在您的业务中发挥作用。

深入了解 AI 解决方案
人工智能服务

通过增加 AI 重塑关键工作流程和运营,最大限度提升体验、实时决策和商业价值。

深入了解人工智能服务
采取后续步骤

一站式访问跨越 AI 开发生命周期的功能。利用用户友好型界面、工作流并访问行业标准 API 和 SDK,生成功能强大的 AI 解决方案。

  1. 深入了解 watsonx.ai
  2. 预约实时演示
脚注

1 Han, H., Wang, Y., Shomer, H., Guo, K., Ding, J., Lei, Y., ... & Tang, J. (2024). 基于图表的检索增强生成。arXiv preprint arXiv:2501.00309.

2 Larson, J., & Truitt, S. (2024). GraphRAG:在叙述性专用数据上解锁 LLM 的发现能力。微软研究所博客。https://www.microsoft.com/cn-zh/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/

3 Edge, D., Trinh, H., Cheng, N., Bradley, J., Chao, A., Mody, A., ... & Larson, J. (2024). 从局部到全局:以查询为中心的摘要的图形 RAG 方法。arXiv preprint arXiv:2404.16130.

4 Peng, B., Zhu, Y., Liu, Y., Bo, X., Shi, H., Hong, C., ... & Tang, S. (2024). 图形检索增强生成:综述。arXiv preprint arXiv:2408.08921.

5 Wu, J., Zhu, J., Qi, Y., Chen, J., Xu, M., Menolascina, F., & Grau, V. (2024). 医疗图形 RAG:通过图形检索增强生成实现安全的医疗大型语言模型。arXiv preprint arXiv:2408.04187.