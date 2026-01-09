人工智能 IT 自动化

与您的数据室对话：Bay Point Advisors 如何为私募市场分析构建安全的 RAG 平台

为了提升客户的关键金融决策能力，Bay Point 构建了 Atlas——一个 AI 驱动的平台，旨在让客户以对话方式与其安全数据室交互。

发布日期 2026年1月9日
By Rick Atkinson and Chad Jennings

准确性与安全性是投资决策的两大关键要求。在评估投资机会时，金融公司通常会创建安全的数据室来存放所有必要的尽职调查资源，帮助投资者做出是否投资的决定。但投资机会往往稍纵即逝，查阅成千上万份 PDF、财务电子表格、关键合同和其他文件后再做出决定，需要花费的时间太长了。

Bay Point Advisors 是一家总部位于亚特兰大的投资管理公司，专注于传统投资者常忽视的私募市场机会。为了提升客户的关键金融决策能力，Bay Point 构建了 Atlas——一个 AI 驱动的平台，旨在让客户以对话方式与其安全数据室交互。用户无需手动浏览文件来了解贷款条款、契约、风险说明和其他关键的交易细节，而是可以直接提出问题，并在几毫秒内获得基于数据室内私人文档的有依据、有引用支持的回答。

问题：大量文件审查工作减慢了决策速度

要在金融环境中可行，Atlas 平台需要提供以下能力：

  • 高精度检索
  • 有依据且可解释的回答
  • 严格的权限管理和数据隔离
  • 运营负担低
  • 与 Bay Point 现有的 .NET 和 Angular 堆栈集成

Atlas 通过检索增强生成 (RAG)，将语义搜索与 AI 驱动的摘要相结合，解决了这一挑战。

架构：生产级 RAG 工作流

Atlas 将 Bay Point 的 .NET 和 Angular 堆栈与 IBM® watsonx.data 上的 Astra DB、Azure Blob Storage、Azure OpenAI 以及一个 SQL 元数据层相结合。其架构围绕两个协同流程而设计：

  • 客户使用的聊天工作流
  • 管理员（负责上传的授权管理员）使用的文档提取工作流

1. 投资者查询工作流（聊天流程）

当客户提交问题时，Atlas 会对用户进行身份验证，并从 SQL 元数据层检索上下文，以确保检索范围仅包含授权文档。使用每个文档的相关元数据（例如数据室 ID 和权限级别）执行严格筛选。

系统将问题和用户上下文发送到 Astra DB，Astra DB 将文本转发到 Azure OpenAI 的嵌入模型进行矢量化。使用生成的矢量查询 Astra DB 的矢量存储，检索最相关的文本块和相关元数据。

然后，Atlas 会将用户的问题、提示说明、之前的聊天记录和检索到的数据块发送到 Azure OpenAI 聊天模型，该模型会生成有依据、包括详细引用来源、使用自然语言的回复。

Atlas 聊天流程：经过身份验证的问题通过数据 API 进入嵌入模型，然后进入 Astra DB 进行矢量检索，最终进入 Azure OpenAI 生成附带引用来源的回答。 图 1. Atlas 聊天流程：经过身份验证的问题通过数据 API 进入嵌入模型，然后进入 Astra DB 进行矢量检索，最终进入 Azure OpenAI 生成附带引用来源的回答。

2. 文档提取工作流（文档嵌入流程）

当 Bay Point 员工将文档上传到数据室时，Atlas 将文件移动到 Azure Blob Storage 中，并将其元数据记录在 Atlas 的 SQL 数据库中。提取文本并将其分割成易于管理的片段（分块）。每个分块都标注有元数据，以确保在检索过程中实现正确的访问控制和可跟踪性。

然后将分块发送到矢量数据库，该数据库使用 Azure OpenAI 嵌入模型对每项数据进行矢量化。生成的矢量与文档 ID、数据室标识符和权限元数据一同写入 Astra DB 的矢量数据库。

由于每个分块独立存储，替换或更新文档只需部分重新索引，从而降低了运营成本和复杂性。

Atlas 文档嵌入流程：管理员将文档上传到数据室，文档随后会发送到 Blob Storage。然后，通过数据 API 进行提取、分块和嵌入，并将结果写入 Astra DB 中的矢量存储。 图 2. Atlas 文档嵌入流程：管理员将文档上传到数据室，文档随后会发送到 Blob Storage。然后，通过数据 API 进行提取、分块和嵌入，并将结果写入 Astra DB 中的矢量存储。

工程考量：构建可靠的 RAG 系统所需的条件

构建 Atlas 需要考虑多项审慎的工程选择，以满足私募市场工作流程的严格要求。

检索模型和生成模型分离

Atlas 使用一个模型进行嵌入，另一个模型来生成回答。这样分离提高了检索精度，并能生成比单个多用途模型更连贯的摘要。

使用数据 API 进行 REST 驱动的集成

Astra DB Data API 及其 REST 接口和 .NET SDK 使工程团队能够以最小的阻力将矢量计算集成到现有代码库中。这样就无需采用新语言或部署额外的基础设施。

元数据驱动的访问控制

权限管理是使用在提取过程中设置的元数据在分块级别执行的。在检索过程中，只会考虑获得授权的分块，确保始终基于用户有权查看的文档进行回答。

通过部分重新索引实现高效维护

当需要更改、替换或删除文档时，Atlas 无需重新处理整个数据集。只有受影响的文件会被重新索引，实现快速提取且易于管理。

通过供应商支持提高运营速度

在 IBM 的直接支持渠道和实施指南的帮助下，Bay Point 工程团队加速了开发进程。这在设计检索工作流和调整嵌入参数时尤为重要。支持团队使用 Langflow（IBM 直观的拖放开发 GUI）来帮助 Bay Point 团队清晰了解 Atlas 项目的架构要求和整体可行性。

结果：洞察分析更快速、治理更完善、信心更坚定

Atlas 显著改善了客户和分析师与私募市场数据的交互方式，从而实现：

  • 更快生成洞察分析：关键信息可在数秒内呈现
  • 依据始终一致：回复中包含引用来源
  • 降低错误率：通过约束性提示减少幻觉
  • 提高工作效率：减少手动浏览文档的时间
  • 强大的治理：端到端执行文档级别的权限管理

该平台将静态、非结构化的文档集转化为可搜索的对话式知识层，加速尽职调查工作流程。

未来发展：面向投资工作流的 agentic AI

Atlas 正在向 agentic AI 发展，其中自主流程可以利用私人文档、市场信息和公共数据集，以获取与投资相关的新信息。未来可能具备的能力包括：

  • 新文档影响交易条款时发送通知
  • 跨文档一致性检查
  • 监测监管或市场变化
  • 主动提供文档更新摘要

这一进展将 Atlas 从被动问答转变为主动智能。

安全、可扩展的金融 RAG 架构

Atlas 展示了 RAG 如何在私募市场投资的约束条件下安全、可靠地运营。Astra DB 提供矢量存储、低延迟检索和基于 REST 的集成，为 Atlas 的语义搜索功能提供支持。Azure OpenAI 提供推理层，可合成有依据、引证丰富的回复。

这些部分协同工作，使 Bay Point Advisors 能够将私营市场尽职调查转变为快速、对话式、可治理的体验，整个过程完全基于公司自身数据，并且符合金融行业的安全要求。

Rick Atkinson

CTO

Bay Point Advisors

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM