데이터 룸과 대화하다: Bay Point Advisors가 비상장 시장 분석을 위해 보안 RAG 플랫폼을 구축한 방법
Bay Point는 고객들이 중요한 재무 결정을 더 빠르게 내릴 수 있도록 AI 기반 플랫폼인 Atlas를 개발했습니다. 이 플랫폼은 사용자가 자신의 데이터 룸과 대화하듯 상호작용 할 수 있도록 설계되었습니다.
정확성과 보안은 투자 의사결정에 있어 가장 중요한 두 가지 필수 요건입니다. 금융 기업은 투자 기회를 검토할 때 투자자가 '진행' 또는 '중단' 여부를 결정하는 데 필요한 모든 실사 자료를 보관하기 위해 보안 데이터 룸을 구축하는 경우가 많습니다. 그러나 투자 기회는 순식간에 사라지는 경우가 많습니다. 수천 건의 PDF, 재무 스프레드시트, 주요 계약서 및 기타 문서를 일일이 검토하며 결정을 내리기에는 시간이 너무 오래 걸릴 수 있습니다.
애틀랜타에 본사를 둔 투자 운용사인 Bay Point Advisors는 기존의 투자자들이 간과하기 쉬운 비상장 시장의 기회에 집중하고 있습니다. Bay Point는 고객들이 중요한 재무 결정을 더 빠르게 내릴 수 있도록 AI 기반 플랫폼인 Atlas를 개발했습니다. 이 플랫폼은 사용자가 자신의 데이터 룸과 대화하듯 상호작용 할 수 있도록 설계되었습니다. 대출 조건, 약정 조항, 리스크 참고 사항 등 거래의 핵심 정보를 찾기 위해 파일을 수동으로 검토하는 대신 사용자는 질문을 통해 데이터 룸 내 비공개 문서에서 근거 기반의 인용형 답변을 밀리초 단위로 받아볼 수 있습니다.
금융 환경에서 실효성을 갖추기 위해 Atlas 플랫폼은 다음과 같은 요건을 충족해야 했습니다.
Atlas는 시맨틱 검색과 AI 요약 기능을 결합한 검색 증강 생성(RAG) 기술을 통해 이 문제를 해결합니다.
Atlas는 Bay Point의 .NET 및 Angular 스택에 IBM® watsonx.data 기반의 Astra DB, Azure Blob Storage, Azure OpenAI 그리고 SQL 메타데이터 계층을 결합해 구성됩니다. 이 아키텍처는 유기적으로 연결된 두 가지 파이프라인으로 구성됩니다.
고객이 질문을 입력하면 Atlas는 사용자를 인증하고 SQL 메타데이터 계층에서 컨텍스트를 검색하여 권한이 있는 문서만 검색 범위에 포함되도록 합니다. 룸 ID 및 권한 수준 등 각 문서와 연결된 메타데이터를 사용하여 엄격한 필터링을 적용합니다.
질문과 사용자 컨텍스트는 Astra DB로 전송되며 Astra DB는 해당 텍스트를 벡터화하기 위해 Azure OpenAI 임베딩 모델로 전달합니다. 생성된 벡터는 Astra DB의 벡터 스토어를 조회하는 데 사용되며 이를 통해 가장 관련성 높은 텍스트 청크와 관련 메타데이터를 검색합니다.
이후 Atlas는 사용자의 질문, 프롬프트 지침, 이전 채팅 이력, 검색된 청크 등을 Azure OpenAI 챗 모델에 전달하고 모델은 근거에 기반한 자연어 응답을 생성해 상세한 인용 정보와 함께 제공합니다.
Bay Point 직원이 데이터 룸에 문서를 업로드하면 Atlas는 해당 파일을 Azure Blob Storage로 이동시키고 관련 메타데이터를 Atlas의 SQL 데이터베이스에 기록합니다. 문서에서 텍스트를 추출한 후 처리하기 쉬운 세그먼트로 나누는 청킹 작업을 수행합니다. 각 텍스트 청크에는 메타데이터가 할당되어 검색 시 정확한 접근 제어와 추적 가능성을 보장합니다.
청크는 벡터 데이터베이스로 전송되며 Azure OpenAI 임베딩 모델을 통해 각 조각을 벡터화합니다. 생성된 벡터는 문서 ID, 룸 식별자 및 권한 메타데이터와 함께 Astra DB 벡터 데이터베이스에 저장됩니다.
각 청크가 독립적으로 저장되기 때문에 문서 교체 또는 업데이트 시 부분적인 재색인만 수행하면 되므로 운영 비용과 복잡성이 줄어듭니다.
Atlas를 구축하는 과정에서 비상장 시장 워크플로의 엄격한 요구 사항을 충족하기 위해 몇 가지 신중한 엔지니어링 선택이 필요했습니다.
Atlas는 임베딩용 모델과 답변 생성용 모델을 분리해 사용합니다. 이러한 분리는 단일 범용 모델을 사용하는 것보다 검색 정밀도를 높이고 더 일관성 있는 요약 결과를 생성할 수 있습니다.
REST 인터페이스와 .NET SDK를 제공하는 Astra DB 데이터 API 덕분에 엔지니어링 팀은 기존 코드 베이스에 벡터 연산을 최소한의 마찰로 통합할 수 있었습니다. 이를 통해 새로운 언어를 도입하거나 별도의 인프라를 구축할 필요가 없어졌습니다.
권한 관리는 수집 단계에서 설정된 메타데이터를 활용해 청크 단위로 적용됩니다. 검색 시에는 권한이 부여된 청크만 고려되므로 사용자가 열람 권한을 가진 문서에서만 답이 생성되도록 보장합니다.
Atlas는 문서를 변경, 교체 또는 삭제 시 전체 데이터 세트를 다시 처리할 필요가 없습니다. 영향을 받는 파일만 재색인하므로 데이터 수집을 빠르고 관리 가능한 수준으로 유지합니다.
Bay Point 엔지니어링 팀은 IBM의 직접적인 지원 채널과 구현 가이드를 통해 개발 속도를 높였습니다. 이는 특히 검색 워크플로를 설계하고 임베딩 파라미터를 조정하는 과정에서 매우 중요한 역할을 했습니다. 지원 팀은 IBM의 직관적인 드래그 앤 드롭 방식 개발 GUI인 Langflow를 활용하여 Bay Point 팀이 Atlas 프로젝트의 아키텍처 요구 사항과 전반적인 실행 가능성을 시각화할 수 있도록 지원했습니다.
Atlas는 고객과 분석가가 비상장 시장 데이터와 상호작용하는 방식을 획기적으로 개선하여 다음과 같은 성과를 거두었습니다.
이 플랫폼은 정적인 비정형적인 문서 집합을 검색 가능하고 대화형으로 활용할 수 있는 지식 계층으로 전환해 실사 워크플로를 가속화합니다.
Atlas는 자율적인 프로세스가 비공개 문서뿐만 아니라 시장 정보 및 공계 데이터 세트까지 활용하여 투자 관련 신규 정보를 직접 확보할 수 있는 에이전틱 AI로 진화하고 있습니다. 향후에는 다음과 같은 기능이 추가될 수 있습니다.
이러한 진화를 통해 Atlas는 수동적인 질의응답 시스템에서 선제적인 인텔리전스로 거듭나게 됩니다.
Atlas는 RAG가 비상장 시장 투자의 제약 조건 하에서도 RAG가 얼마나 안전하고 신뢰성 있게 작동할 수 있는지 보여줍니다. Astra DB는 Atlas의 시맨틱 검색을 지원하는 벡터 스토리지, 저지연 검색 및 REST 기반 통합 기능을 제공합니다. Azure OpenAI는 근거 기반의 풍부한 인용을 갖춘 응답을 생성하는 추론 계층 역할을 수행합니다.
이러한 구성 요소들이 결합된 덕분에 Bay Point Advisors는 비상장 시장 실사 업무를 빠르고 대화 중심적이며 관리가 용이한 경험으로 혁신할 수 있었습니다. 특히 이 모든 과정은 자체 데이터에 기반하여 구동되며 금융권의 보안 요구 사항을 완벽하게 충족합니다.