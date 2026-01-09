Inteligência artificial Automação de TI

Converse com sua sala de dados: como a Bay Point Advisors construiu uma plataforma RAG segura para análise de mercado privado.

Para acelerar a capacidade dos clientes de tomar decisões financeiras críticas, a Bay Point criou o Atlas, uma plataforma impulsionada por IA projetada para permitir que os clientes interagissem de forma conversacional com suas salas de dados seguras.

Publicado 09/01/2026
Dois colegas de trabalho sentados em cadeiras em um escritório com grandes janelas à direita
By Rick Atkinson and Chad Jennings

Precisão e segurança são dois requisitos críticos para a tomada de decisões de investimento. Ao analisar oportunidades de investimento, as empresas financeiras geralmente criam salas de dados seguras para manter todas as fontes de devida diligência necessárias para ajudar os investidores a tomar uma decisão de iniciar ou não. Mas as oportunidades de investimento geralmente são passageiras; analisar milhares de PDFs, planilhas financeiras, contratos críticos e outros documentos para chegar a uma decisão pode demorar demais.

A Bay Point Advisors é uma empresa de gestão de investimentos sediada em Atlanta que se concentra em oportunidades de mercado privado que os investidores tradicionais geralmente ignoram. Para acelerar a capacidade dos clientes de tomar decisões financeiras críticas, a Bay Point criou a Atlas, uma plataforma impulsionada por IA projetada para permitir que os clientes interagissem de forma conversacional com suas salas de dados. Em vez de escanear manualmente arquivos em busca de termos de empréstimo, cláusulas de risco e outros detalhes críticos da negociação, os usuários fazem perguntas diretas e recebem respostas fundamentadas, baseadas em citações, provenientes dos documentos privados dentro da sala de dados, em milissegundos.

O problema: revisão de documentos em alto volume atrasa decisões

Para ser viável em ambientes financeiros, a plataforma Atlas precisava entregar os seguintes itens:

  • Recuperação de alta precisão
  • Respostas fundamentadas e explicáveis
  • Permissões rigorosas e isolamento de dados
  • Baixa carga operacional
  • Integração perfeita com a stack .NET e Angular existente da Bay Point

O Atlas aborda esse desafio com a geração aumentada de recuperação (RAG), combinando pesquisa semântica com sumarização orientada por IA.

Arquitetura: fluxo de trabalho RAG de nível de produção

O Atlas combina o .NET da Bay Point e a pilha Angular com o Astra DB no IBM watsonx.data, Azure Blob Armazenamento, Azure OpenAI e uma camada de metadados SQL. Sua arquitetura é organizada em torno de dois pipelines coordenados:

  • O fluxo de trabalho do chat usado pelos clientes
  • O fluxo de trabalho de ingestão de documentos para administradores (administradores autorizados responsáveis por uploads)

1. Fluxo de trabalho de consulta do investidor (processo de chat)

Quando um cliente envia uma pergunta, o Atlas autentica o usuário e recupera o contexto da camada de metadados SQL para garantir que apenas documentos autorizados sejam incluídos na recuperação. Os metadados associados a cada documento, como ID da sala e nível de permissão, são usados para impor uma filtragem rigorosa.

A pergunta e o contexto do usuário são enviados para o Astra DB, que encaminha o texto para o modelo de embedding do Azure OpenAI para vetorização. O vetor resultante é usado para consultar o armazenamento de vetores do Astra DB, recuperando os fragmentos de texto mais relevantes e metadados associados.

Em seguida, o Atlas envia a pergunta do usuário, as instruções de prompt, o histórico de bate-papo anterior e os fragmentos recuperados para um modelo de bate-papo do Azure OpenAI, que gera uma resposta fundamentada em linguagem natural que inclui citações detalhadas.

Fluxo de chat do Atlas: uma pergunta autenticada vai para o embedding por meio da API de dados, depois para a recuperação de vetores do Astra DB e resulta na geração de respostas do Azure OpenAI com citações. Figura 1. Fluxo de bate-papo Atlas: uma pergunta autenticada vai para o embedding por meio da API de dados, depois para a recuperação de vetores do Astra DB e resulta em resultados na geração de respostas do Azure OpenAI com citações.

2. Fluxo de trabalho de ingestão de documentos (pipeline de embedding de documentos)

Quando um funcionário da Bay Point faz upload de documentos para uma sala, a Atlas migra os arquivos para o Azure Blob Storage e registra seus metadados no SQL database da Atlas. O texto é extraído e fragmentado em segmentos gerenciáveis. Cada fragmento é carimbos com metadados para garantir o controle de acesso correto e a rastreabilidade durante a recuperação.

Os fragmentos são então enviados para o banco de dados de vetores, que utiliza o modelo de embedding do Azure OpenAI para vetorizar cada peça. Os vetores resultantes (junto com IDs de documentos, identificadores de sala e metadados de permissão) são gravados no banco de dados de vetores do Astra DB.

Como cada fragmento é armazenado de forma independente, substituir ou atualizar um documento requer apenas reindexação parcial, reduzindo o custo operacional e a complexidade.

Pipeline de embedding de documentos do Atlas: um administrador carrega documentos de sala, que são enviados para o Armazenamento de Blob. Em seguida, a extração, a fragmentação e o embedding ocorrem por meio da API de dados e são gravados no armazenamento de vetores no Astra DB. Figura 2. Pipeline de embedding de documentos do Atlas: um administrador carrega documentos da sala, que são enviados para o Armazenamento de Blob. Em seguida, a extração, a fragmentação e o embedding ocorrem por meio da API de dados e são gravados no armazenamento de vetores no Astra DB.

Considerações de engenharia: o que é preciso para construir um sistema de RAG confiável

A construção do Atlas exigiu várias escolhas de engenharia deliberadas para atender ao rigor dos fluxos de trabalho do mercado privado.

Separação de modelos de recuperação e geração

O Atlas usa um modelo para embeddings e outro para geração de respostas. Essa divisão melhora a precisão da recuperação e produz resumos mais coerentes do que um único modelo multipropósito.

Integração orientada por REST usando a API de dados

A API de dados do Astra DB, com sua interface REST e SDK .NET, permitiu que a equipe de engenharia integrasse operações vetoriais à base de código existente com atrito mínimo. Isso eliminou a necessidade de adotar novos idiomas ou implementar infraestrutura adicional.

Controle de acesso orientado por metadados

A permissão é aplicada no nível de fragmento usando metadados definidos durante a ingestão. Durante a recuperação, somente fragmentos autorizados são considerados, garantindo que as respostas sejam sempre provenientes de documentos que o usuário tem permissão para visualizar.

Manutenção eficiente por meio da reindexação parcial

O Atlas não precisa reprocessar conjuntos de dados inteiros quando um documento precisa ser alterado, substituído ou excluído. Somente os arquivos afetados são reindexados, mantendo a ingestão rápida e gerenciável.

Velocidade operacional por meio do suporte do fornecedor

A equipe de engenharia da Bay Point acelerou o desenvolvimento com a ajuda dos canais de suporte direto e da orientação de implementação da IBM. Isso foi particularmente importante durante o design dos fluxos de trabalho de recuperação e o ajuste dos parâmetros de embedding. A equipe de suporte usou o Langflow, a interface intuitiva de desenvolvimento arrastar e soltar da IBM, para ajudar a equipe de Bay Point a visualizar os requisitos arquitetônicos e a viabilidade geral do projeto Atlas.

Resultados: insights mais rápidos, melhor governança, maior confiança

O Atlas melhora significativamente a forma como clientes e analistas interagem com dados de mercado privado, resultando em:

  • Geração de insights mais rápida: as principais informações vêm à tona em segundos
  • Fundamentos consistentes: as respostas incluem citações de fontes
  • Taxas de erro mais mais baixas: as alucinações são reduzidas por meio de prompts restritos
  • Produtividade aprimorada: menos tempo gasto na digitalização manual de documentos
  • Governança sólida: permissões em nível de documento mantidas de ponta a ponta

A plataforma transforma conjuntos de documentos estáticos e não estruturados em uma camada de conhecimento pesquisável e conversacional que acelera os fluxos de trabalho de devida diligência.

O que vem a seguir: IA agêntica para fluxos de trabalho de investimento

O Atlas está evoluindo em direção à IA agêntica, onde processos autônomos podem acessar documentos privados junto com informações de mercado e conjuntos de dados públicos para obter novas informações relevantes para um investimento. Recursos futuros podem incluir:

  • Notificações quando novos documentos afetam os termos da negociação
  • Verificação de consistência entre documentos
  • Monitoramento de mudanças regulatórias ou de mercado
  • Resumos proativos de atualizações de documentos

Essa progressão muda o Atlas de resposta a perguntas reativa para inteligência proativa.

Uma arquitetura RAG segura e escalável para finanças

O Atlas demonstra como a RAG pode operar de forma segura e confiável dentro das restrições do investimento no mercado privado. O Astra DB fornece o armazenamento, a recuperação de baixa latência e a integração baseada em REST que alimentam a pesquisa semântica do Atlas. O Azure OpenAI fornece a camada de raciocínio que sintetiza respostas fundamentadas e ricas em citações.

Juntos, esses componentes permitem que a Bay Point Advisors transforme a due diligence de mercado privado em uma experiência rápida, conversacional e governável, totalmente impulsionada pelos próprios dados da empresa e alinhada com as demandas de segurança do setor financeiro.

Saiba mais sobre o Astra DB

Rick Atkinson

CTO

Bay Point Advisors

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM