Vista aérea do centro da cidade de Nova York

Da dor de cabeça dos contratos ao ativo estratégico: como a Edsvard entende os dados imobiliários não estruturados com o IBM Cloud e o watsonx.data

Saiba como esse provedor de tecnologia sueco usa IA para extrair dados-chave de contratos complexos, sinalizar riscos e proteger a receita.

Os contratos imobiliários são os principais candidatos à automação. Eles são densos, inconsistentes entre proprietários e jurisdições e repletos de cláusulas pequenas que geram consequências financeiras significativas. Essas cláusulas incluem janelas de renovação, fórmulas de indexação, inclusões de serviços, obrigações de locatários e exceções que nunca chegam de forma limpa aos sistemas posteriores.

A empresa sueca Edsvard Hallbarhet AB reconheceu esse desafio e criou um sistema para transformar a ampla gama de documentos associados a transações imobiliárias e administração de propriedades em dados estruturados e verificáveis por máquina no momento da ingestão. Essa abordagem significa que os clientes podem interromper a indexação manual de documentos, detectar antecipadamente incompatibilidades em faturas e revelar cláusulas de risco antes que se tornem disputas ou perda de receita. Tudo em uma interface simples de usar e impulsionada por IA.

A empresa de IA criou uma solução com base no IBM Cloud (escolhido por seus recursos híbridos flexíveis) e no watsonx.data, cujos recursos de lakehouse aberto ajudaram a simplificar e agilizar a arquitetura da Edsvard. Essa abordagem simplificou o processo, removendo a necessidade de migrar dados para enriquecimento e processamento.

Caso de uso: transformação de contratos em ativos estratégicos

A solução da Edsvard,Contract Intelligence, usa IA para extrair termos e pontos de dados importantes diretamente dos contratos. Essa análise é, então, cruzada com outros sistemas de registro, como faturas, livros-razão, declarações de energia e notificações, para encontrar discrepâncias e acionar uma ação.

Além da conciliação numérica, o Contract Intelligence também sinaliza cláusulas de risco que podem alterar significativamente a exposição de um contrato, mesmo quando os números principais parecem precisos. A solução deles precisa funcionar para implementações pequenas e grandes. Tudo, desde 100 documentos para valores específicos até implementações em grande escala em centenas de milhares de documentos, como é comum entre os clientes da empresa nos EUA.

Arquitetura técnica: criação de uma imagem contratual precisa

Tecnicamente, a plataforma é construída como um sistema de duas camadas. Uma camada de origem contém uma variedade de dados não estruturados: PDFs, documentos do Word, planilhas, conjuntos de slides e até mesmo fotos de dispositivos móveis. A segunda camada consiste em uma camada de IA que executa o Contract Intelligence (e um recurso paralelo de inteligência de faturas) exposto por meio de uma API.

Diagrama da arquitetura da solução Contract Intelligence Visão arquitetônica da solução Contract Intelligence

A solução é executada como um serviço no IBM Cloud e também foi projetada para ser executada no watsonx.data, em outros provedores de nuvem e no local, quando necessário. Esse requisito híbrido surgiu no campo: clientes maiores insistiam cada vez mais em implementações em nuvem privada ou no local devido a preocupações regulatórias e de privacidade. A estratégia "híbrida por design" da IBM foi uma das principais razões pelas quais ela atraiu a equipe da Edsvard.

Dentro da camada de sistemas de IA, o pipeline é deliberadamente simples e voltado para a produção: extração de texto para documentos digitais nativos; reconhecimento óptico de caracteres (OCR) para entrada baseada em imagens; preparação do texto; e Named Entity Recognition como parte do processo de normalização antes da inferência do modelo.

Dependendo da etapa, um único componente pode ser atribuído para executar a tarefa, ou pode haver vários, dos quais o mais apropriado é selecionado automaticamente. Por exemplo, a etapa de OCR pode empregar o Tesseract de código aberto, o PaddlePaddle ou outro mecanismo de OCR.

O trabalho diferenciado acontece no ciclo de modelagem e adaptação. A Edsvard emprega um sistema de anotação e uma estratégia de modelo de idioma personalizado: a equipe optou por construir seu próprio modelo personalizado otimizado para idiomas de destino específicos, incluindo inglês, sueco, espanhol, italiano e vários outros. O trabalho incluiu mais treinamento de domínio para tipos de contratos e ajuste fino específico para cada cliente orientado por anotações.

Todas essas ações visam extrair os campos exatos que importam (números de contratos, períodos de validade, área de propriedade, seções de edifícios, aluguel e tempo de renovação ou rescisão, por exemplo).

A Edsvard optou por construir seu próprio modelo para que pudesse otimizar seu tamanho, arquitetura e treinamento, levando a um treinamento e uma inferência mais rápidos. Essa ação também resultou em uma pegada de memória menor. A equipe descobriu que essa abordagem era mais determinística, garantindo a melhor qualidade de dados possível.

Os campos extraídos são montados em um "estado preciso do contrato", persistidos em um armazenamento de séries temporais(watsonx.data) e, depois, obtidos por meio de APIs e dashboards. Para inteligência de contratos, a Edsvard acabou criando um dashboard personalizado para a saída — a equipe inicialmente usou o Elasticsearch Kibana, mas não conseguiu atingir o nível de usabilidade necessário. Para inteligência de faturas, às vezes os clientes preferem que os valores extraídos sejam enviados diretamente de volta para seus próprios sistemas.

Captura de tela do dashboard de IU do Contract Intelligence Exemplo da interface do Contract Intelligence

Uma decisão arquitetônica fundamental, relevante para escalabilidade e TCO, é que a inteligência de contratos seja entregue como um serviço REST e não esteja vinculada a nenhum portal de documentos único.

O sistema de origem Samporten (uma oferta de software de rastreamento de projetos desenvolvida pela Edsvard) foi ideal para os casos de uso originais de propriedade e construção. No entanto, o novo sistema pode se integrar facilmente a um ambiente DMS/CRM/ERP existente e pode, por exemplo, rastrear o SharePoint para processar documentos onde eles já estão.

O watsonx.data é um facilitador fundamental aqui: ele permite que a plataforma traga os dados e os processe no local, minimizando a movimentação de dados e pipelines personalizados de extrair, transformar e carregar (ETL), ao mesmo tempo em que enriquece os dados onde estão. Esse processo reduz a sobrecarga operacional, a latência e possíveis falhas.

Impacto: estabilidade e escala

O impacto nos negócios está centrado em resultados operacionais mensuráveis, com os quais engenheiros e gerentes de produtos tendem a se importar: redução de mais de 90% no manuseio manual, melhor qualidade de dados (menos informações perdidas entre sistemas), melhor recurso de forecasting com modelos de cálculo comuns e maior estabilidade financeira. Frequentemente, os clientes da Edsvard também relatam uma melhor capacidade de negociar com os bancos.

Do ponto de vista operacional, a plataforma facilita escalar os fluxos de trabalho de centenas para milhares e a integração de novas propriedades ao processar contratos em vez de reconstruir processos. Para as equipes de propriedades, termos de faturamento mais precisos e janelas de renovação mais claras também podem reduzir as disputas com os inquilinos e encurtar os ciclos de conciliação de faturamento.

Resultados: uma plataforma modular de IA

Ao criar com base no IBM Cloud e no watsonx.data (e ao projetar para a implementação híbrida desde o início), a Edsvard transformou um desafio de conciliação de contratos em uma plataforma modular de IA para documentos. Essa plataforma pode ser implementada como um serviço, integrar-se a sistemas corporativos existentes (incluindo o SharePoint) e escalar de pequenas implementações do assistente da Nordic AI para lançamentos em vários locais sem reconstruir a camada de ingestão e dados.

Olhando para o futuro, a equipe pretende desenvolver com o IBM Power11 para oferecer uma solução de "caixa única", de ponta a ponta, no local. A equipe também está explorando como a IA agêntica pode automatizar ações de acompanhamento depois que os contratos forem compreendidos. O resultado líquido é uma base que pode se expandir para novos tipos de documentos, novos ambientes e novos fluxos de trabalho, mantendo a área de superfície de engenharia estável e a experiência do usuário focada em precisão e usabilidade.

Saiba mais sobre a IBM Cloud

Saiba mais sobre watsonx.data

Katarina Gospic

Cofounder and Chief Global Officer

Petri Sysilahti

Product Manager, Contract Intelligence, Edsvard

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM