人工智能 计算和服务器 IT 自动化

面向法律检索的生产级 RAG 系统：Shorthills AI 如何借助 IBM watsonx.data 扩展数据检索能力

通过使用 IBM watsonx.data 上的 Astra DB 作为向量数据库，并利用 Langflow 加速构建 RAG 系统时的迭代过程，Shorthills 在召回率与精确度上获得了 60% 的改进。

发布日期 2026年1月28日
两位商务女性在现代办公桌前进行讨论

语义检索与检索增强生成 (RAG) 等现代人工智能技术，能够减少律师事务所在长篇文档中搜寻信息的时间。这些技术通过查找概念相关的章节、总结关键内容并返回可追溯的引用来实现，确保结果可验证。

若实施得当，这能将法律研究从手动“打开十个标签页”的工作流程，转变为具有引导性、证据支撑的检索体验，同时不降低法律团队所要求的严谨性。在法律检索中，用户不仅需要一个答案，更需要正确的答案。这个答案必须由恰当的权威依据、相关例外情形以及可供直接引用的确切段落快速佐证。

面向法律行业的 AI 洞察解决方案

基于此目标，总部位于新泽西州的 Shorthills AI 通过运用 RAG 和知识图谱技术，开发了以领域定制化优化聊天机器人为形式的生成式 AI 智能体框架。该框架为法律行业提供 AI 驱动的洞察，既追求原始速度，也注重相关性、完整性与可追溯来源。

通过在构建 RAG 系统时使用 Astra DB on IBM watsonx.data 作为向量数据库，并使用 Langflow 加速迭代，Shorthills 的召回率与精确度提高了 60%。

IBM 解决方案还帮助将结果全面性——即结果捕捉用户查询细节与维度的完整程度——提升了 4 倍。同时，结果多样性——为用户提供多重解读视角而非单一推理路径的能力——提升了 9 倍。此功能对于法律工作流程中准备论点与反驳至关重要。

实践应用：提升相关性、完整性与可信度的大规模法律文档检索

法律部门在处理数十万份法律文档数据集时，需要可靠的检索能力、针对问题的多角度分析以及将结果追溯至源文件的功能。仅获得 70% 的答案可能带来重大风险，而 AI 幻觉在法律场景中是不可接受的。

对许多法律行业客户而言，部署环境是关键制约因素。部分组织因监管限制，可能无法将法律内容中的敏感数据交由超大规模云服务商托管。这些限制可能要求知识库必须保留在本地，例如包含个人身份信息 (PHI) 或受保护健康信息 (PHI) 的内容。

技术架构：支持混合 RAG/关键词搜索与图谱检索的可扩展流程

Shorthills 的法律 AI 系统包含两条流程链：

  1. 文档与数据摄取处理流程
  2. 查询检索流程，支持关键词、向量及图谱检索多模式，并能根据查询意图自动路由至相应技术模块

1. 摄取流程：从原始法律文件到可检索结构

文件首先导入数据湖，经处理后确保大规模检索的可靠性：

  • 文档切分为较小片段，注重语义完整性——不仅按字符或字数机械分割，而是保留定义、引用和论证结构等上下文信息。
  • 基于大语言模型 (LLM)实体提取：识别法律相关字段，如法官姓名、案件名称、案件类型、文档编号及判决类型。随后构建实体关系图，供后续检索阶段使用。
  • 通过嵌入模型生成文档向量并存储，为大规模向量检索及混合检索提供支持。Shorthills 选用 Astra DB 作为可检索数据的存储基础。
PDF 处理与数据存储 PDF 处理与数据存储：新 PDF 文件被读取后分割为文本块（如段落或章节），已处理文件的 ID 将回存至 CSV 文件。该方法生成可供分析的结构化分块文本，并更新追踪记录以避免重复处理。
分块与实体关系提取 分块与实体关系提取：文本块发送至 Amazon Bedrock 进行实体识别（如人物、机构）及其关系提取（例如“任职于”、“位于”）。LLM 原始输出（非结构化文本）暂存于本地 JSON 文件。数据随后被解析为清晰的结构化格式：实体作为标注项，关系作为实体间连接。同时生成文本块的向量嵌入（数值表示）并存储至向量数据库，以供后续检索使用。

2. 查询流程：路由选择、混合检索与重排序机制，兼顾相关性与响应速度

在查询端，Shorthills 针对生产环境采用实用主义原则：避免依赖单一通用搜索方法。

  • 关键词搜索适用于精确标识符查询，如文档编号或 ID。
  • 向量搜索能提升自然语言问题的语义匹配能力，例如识别“display”与“screen”可能指向同一概念。
  • 图谱搜索可捕捉文档间关联，但大规模使用时可能速度缓慢且占用大量内存，因此需选择性使用。
知识库上层的搜索流程 知识库上层的搜索流程：用户查询通过 API 网关路由，触发由 Amazon Bedrock 驱动的混合搜索（关键词与向量结合），相关数据从 watsonx 中检索获取。数据随后通过去重和排序层处理，最终以精炼且上下文丰富的搜索结果形式返回给用户。

为实现该方案，系统内置路由模块，可根据用户意图将查询分发至关键词、向量或图谱搜索。每种选择对应不同的时间成本与资源消耗权衡。

其他关键设计考量包括：

  • 需要可扩展的混合搜索实施方案，在适当时机结合关键词搜索、向量搜索与图谱能力。该方案既能提升搜索准确性，也能避免因文档库扩大而导致系统性能下降。
  • 系统在检索后设有重排序阶段，在返回用户前进一步提升相关性。

体验设计不仅限于聊天界面。在此法律检索用例中，用户可获取多种数据源类型，包括 Word 文档、图像、PDF 及文本文件。

优势：灵活性、安全性与可扩展性

Shorthills 选择基于 IBM 技术栈构建此 AI 助手平台的关键原因，源于法律行业企业部署的现实需求：

  • 对因风险承受能力或法规要求无法将敏感数据迁移至超大规模云服务商的客户而言，本地化支持与数据驻留能力至关重要。
  • IBM watsonx.data 支持跨海量文档的大规模检索扩展。
  • 企业级安全标准可扩展架构，赋能基于 IBM watsonx.data 和 Langflow（用于开发智能体与 RAG 流程的低代码拖拽式环境）构建的 AI 就绪解决方案与 AI 智能体。

这些流程必须在实际工程参数内运行：LLM 对算力需求极高，且本地化扩展需要合适的运行时与部署工具来保证效率。

在可衡量的终端用户成效方面，Shorthills 报告显示：

  • 搜索时间显著缩短，召回率与精确度提升超 60%
  • 结果全面性提升约 4 倍，多样性提升约 9 倍
  • 返回结果中的参考文献与引用支持得到显著改善（此前常缺失相关内容）

影响具体体现在：召回率与精确度提高、全面性与多样性增强、高质量的引用支持。这意味着终端用户花费更少时间搜寻资料，而将更多时间用于分析评估。

为扩展而构建的基础架构

Shorthills 的核心经验是：AI 解决方案的生产环境搜索实践属于迭代式工程任务。从处理少量文档扩展到数千份（乃至更多）文档时，问题本质会发生变化。最终，“搜索”成为持续优化的演进过程——历经关键词搜索、向量搜索、混合搜索到图谱搜索的迭代升级，并通过精细的路由机制确保延迟与成本可控。

通过基于 IBM watsonx.data 与 Langflow 构建系统，Shorthills 为法律专业人士部署了具备企业级扩展能力、能应对企业约束（包括本地化需求）的 AI 驱动搜索系统。该系统不仅带来可量化的相关性提升，更提供了法律终端用户所需的引用依据与多元视角，助力他们自信决策。

类似客户需求与治理要求同样存在于医疗保健、金融服务等行业。底层基础设施的可扩展性使我们能够在全球范围跨行业部署同类解决方案。

作为下一步规划，Shorthills 计划将此检索基础扩展至基于智能体的工作流。在这些工作流中，智能体可自主完成研究、起草并打包输出成果供人工审核，而无需每次重建底层数据与检索架构。

详细了解 IBM watsonx.data

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM