Técnicas modernas de inteligência artificial, como a recuperação semântica e a retrieval-augmented generation (RAG), podem reduzir o tempo que escritórios de advocacia dedicam à busca em documentos longos. Eles trabalham encontrando seções conceitualmente relevantes, resumindo o que importa e retornando citações rastreáveis para que os resultados possam ser validados.
Quando bem executada, essa ferramenta transforma a pesquisa jurídica, que antes era um fluxo de trabalho manual com “dez abas abertas”, em uma experiência de busca guiada e baseada em evidências, sem sacrificar o rigor exigido pelas equipes jurídicas. Na pesquisa jurídica, os usuários não precisam apenas de uma resposta; eles precisam da resposta certa. Essa resposta deve ser fundamentada com as autoridades certas, as exceções relevantes e as passagens exatas que podem ser citadas - de forma rápida.
Com esse objetivo em mente, a Shorthills AI, sediada em Nova Jersey, desenvolveu uma framework de IA generativa na forma de chatbot otimizado para domínios específicos usando RAG e gráfico de conhecimento. Esse framework oferece insights impulsionados por IA para o setor jurídico em que a relevância, a integridade e o fornecimento verificável são tão importantes quanto a velocidade.
Ao usar o Astra DB no IBM watsonx.data como o banco de dados de vetores e o Langflow para acelerar a iteração ao criar sistemas RAG, a Shorthills obtém uma melhoria de 60% no recuperação e na precisão.
As soluções da IBM também ajudam a melhorar cerca de quatro vezes a abrangência — a forma como os resultados capturam os detalhes e os aspectos da consulta do usuário. Eles também oferecem uma melhoria de nove vezes na diversidade — a capacidade de oferecer aos usuários múltiplas interpretações e ângulos em vez de uma única linha de raciocínio. Essa funcionalidade é crítica para preparar argumentos e refutações em fluxos de trabalho jurídicos.
Departamentos jurídicos que precisam analisar um conjunto de dados com centenas de milhares de documentos precisam de recuperação confiável, múltiplas perspectivas sobre uma questão e a capacidade de rastrear os resultados até os documentos de origem. Acertar 70% da resposta pode acarretar riscos significativos, e alucinações são inaceitáveis.
Uma das principais limitações para muitos clientes da área jurídica é a implementação. Algumas organizações podem não conseguir compartilhar dados sensíveis em conteúdo jurídico com provedores de hiperescala devido a restrições regulatórias. Essas restrições podem exigir que uma base de conhecimento permaneça local, como conteúdo que inclui informações de identificação pessoal (PII) ou informações de saúde protegidas (PHI).
O sistema jurídico de IA da Shorthills consiste em dois pipelines:
Os arquivos são importados para um data lake e, em seguida, preparados para que a recuperação funcione de forma confiável em escala:
Em relação à consulta, a Shorthills emprega uma filosofia pragmática em seu ambiente de produção: evitar a dependência de um único método de pesquisa universal.
Para implementar essa abordagem, o sistema inclui roteadores que enviam uma consulta para a pesquisa por palavra-chave, vetor ou gráfico, dependendo da intenção do usuário. Cada opção apresenta diferentes vantagens e desvantagens em termos de tempo e custo.
Outras considerações críticas incluem:
Por fim, a experiência vai além de uma interface que utiliza apenas o chat. Neste caso de uso de pesquisa jurídica, os usuários podem recuperar vários tipos de fontes de dados, incluindo documentos do Word, imagens, PDFs e arquivos de texto.
Um dos principais motivos pelos quais a Shorthills escolheu criar essa plataforma de assistente de IA com o stack da IBM surgiu da realidade da implementação corporativa no mundo jurídico:
Esses processos precisavam operar dentro de parâmetros práticos de engenharia: os LLMs consomem muita computação e o dimensionamento no local exige o tempo de execução e as ferramentas de implementação corretos para garantir a eficiência.
Em termos de resultados mensuráveis para o usuário final, a Shorthills relatou:
O impacto é real: melhoria na recuperação e precisão das informações, maior abrangência e diversidade, além de suporte à citações de alta qualidade. Esse resultado significa que os usuários finais gastam menos tempo procurando material e mais tempo avaliando-o.
A principal lição de Shorthills foi que a busca de soluções de IA na produção é um exercício iterativo de engenharia. A escala, que passa de uma pequena quantidade de documentos para milhares (e até mais), altera o problema. Por fim, a “busca” se torna uma jornada de melhoria contínua, evoluindo por meio de pesquisas por palavras-chave, vetoriais, híbridas e gráficas, com roteamento cuidadoso para que a latência e o custo permaneçam previsíveis.
Com base no IBM watsonx.data e no Langflow, a Shorthills implementou um sistema de pesquisa orientado por IA para profissionais da área jurídica que podem operar em escala, lidar com restrições empresariais, incluindo requisitos locais. O sistema proporciona ganhos mensuráveis de relevância e fornece as citações e a amplitude de perspectivas que os usuários finais da área jurídica precisam para determinar os resultados com confiança.
Existem necessidades dos clientes e requisitos de governança semelhantes em todos os setores, como o de saúde e serviços financeiros. A escalabilidade da infraestrutura subjacente nos permite implementar soluções semelhantes em vários setores e em todo o mundo.
Como próxima etapa, a Shorthills vê essa base de recuperação se estendendo aos fluxos de trabalho baseados em agentes. Nesses fluxos de trabalho, um agente pode pesquisar, redigir e organizar as saídas para revisão humana sem a necessidade de reconstruir o stack subjacente de dados e recuperação a cada vez.