A explosão do conteúdo digital resultou em muitas variações de formatos e layouts de documentos, bem como novos canais de entrada com qualidade ou capacidade variadas de compreensão. Alguém pode estar no banco de trás de um carro de aplicativo, tentando tirar uma foto de uma conta de consumo para solicitar uma licença de estacionamento urgente. Ou pode-se estar trocando e-mails com um paciente, tentando processar um sinistro de saúde enquanto trabalha em um escritório remoto em casa. Em 2018, a Forbes afirmou que os dois anos anteriores geraram 90% dos dados do mundo. Podemos imaginar o quanto isso acelerou em 2020 entre trabalho remoto, telemedicina, engajamentos sociais digitais e muito mais.
Além da explosão de conteúdo digital e canais de entrada, a tecnologia e as técnicas de captura existentes não podem mais ser dimensionadas. Por exemplo, a funcionalidade de impressão digital tem sido usada para especificar zonas de reconhecimento e informações de posição para extrair os dados precisos necessários sobre formatos de documentos específicos ou correspondências de tipos semelhantes. No entanto, com tantos formatos de documentos únicos surgindo de novos programas sociais ou econômicos ou novos relacionamentos B2B, configurá-los leva tempo tanto para fechar negócios, melhorar a economia ou progredir no bem-estar social dos cidadãos. Além disso, folhas de separação como cabeçalhos ou códigos de barras para identificar componentes de uma aplicação não são eficazes quando você tem entradas provenientes de diferentes canais, como dispositivos móveis, e-mail e formulários online.
O resultado é que as organizações estão gastando cada vez mais tempo processando documentos manualmente, onde não podemos apenas culpar a má qualidade da imagem do aparelho de fax. Uma pesquisa de 2019 realizada pela Levvel Research descobriu que 57% dos dados das faturas são inseridos manualmente e 49% das aprovações de faturas exigiam de dois a três aprovadores.
Embora a inteligência artificial (IA) não seja uma novidade, tem sido difícil para as organizações utilizá-la com sucesso para o processamento de documentos semiestruturados e não estruturados. O uso da IA exigiu habilidades significativas de ciência de dados e milhares de documentos de amostra para treinar modelos. Isso, por sua vez, resultou em longos ciclos de coleta de documentos e dados para obter benefícios comerciais.
No entanto, os avanços em IA e ferramentas simples conseguiram acelerar o uso para o processamento de documentos. Primeiro, surgiram algoritmos de deep learning, que começam a imitar o pensamento de um cérebro humano. Esses algoritmos podem identificar padrões contextuais válidos para obter compreensão de informações não estruturadas (como o conteúdo de um documento) e aplicar esse aprendizado a coisas que não viram antes, o que é chamado de aprendizado por transferência. Isso ajuda a reduzir o processo de coleta de documentos e os longos ciclos de treinamento. Em segundo lugar, ferramentas no-code com guias passo a passo simples facilitam para usuários corporativos treinar modelos de IA, formatar ou converter a produção e personalizar a tolerância ao risco empresarial.
Embora a implementação do processamento inteligente de documentos e o uso de modelos de IA possam diferir de acordo com o fornecedor, as atividades principais permanecem as mesmas:
Primeiro, a classificação de documentos é a tarefa de identificar tipos de documentos, como faturas ou formulários de impostos. Usando um conjunto de documentos de amostra, pode-se treinar um modelo de classificação de IA nos diferentes tipos de documentos e nos campos e valores que correspondem a esses tipos de documentos. Essa atividade não apenas alimenta a próxima atividade de extração de dados, mas também permite o aprendizado por transferência para outros tipos de documentos semelhantes e facilita a pesquisa melhor de documentos em repositórios de conteúdo.
Em seguida, a extração inteligente de dados é a atividade principal, na qual informações importantes e relevantes são extraídas da página. Isso consiste na identificação de pares de chave e valor, como um número de conta ou um valor devido, na definição de como os dados devem ser e onde podem estar na página, e no treinamento dos modelos de IA para as informações relevantes em cada um dos diferentes tipos de documento. Nessa etapa, também podem haver metadados extraídos e associados ao documento para facilitar a pesquisa posterior.
Finalmente, a saída de dados consiste em enriquecer os dados extraídos e criar o arquivo de saída final para uso posterior. Os modelos baseados em IA podem ser usados para automaticamente corrigir erros ortográficos comuns, converter dados em formatos de saída padrão (por exemplo, um número de telefone) e formatar dados para parecer consistentes (por exemplo, duas casas decimais para valores em dólares). O último passo é criar o arquivo de saída, normalmente um arquivo JSON, que pode alimentar um fluxo de trabalho ou enviar para um repositório de conteúdo para uso posterior.
Um dos principais beneficiários do processamento inteligente de documentos é a automação de processos, em que dados estruturados já validados podem ser incorporados em transações, permitindo um processamento mais rápido e operações escaláveis. Por exemplo, a configuração manual de um fluxo de trabalho, a entrada de dados e a validação de dados antes podem ter levado horas por um trabalhador humano. Uma integração entre o processamento inteligente de documentos e o fluxo de trabalho pode eliminar essas etapas manuais, e a saída de dados pode ser automaticamente enviada para um processo de negócios. De mesma forma, dados ruins inseridos em um bot de automação robótica de processos (RPA) podem resultar em uma próxima etapa com falha, o que pode levar a um gargalo ou erro em um processo de negócios. Aproveitando a saída contínua do processamento inteligente de documentos, um bot de RPA pode ser expandido para toda a organização com mais facilidade. Por fim, os dashboards de visualização podem capacitar os usuários corporativos a descobrir padrões e insights relacionados aos dados extraídos ou gargalos nos processos de negócios, o que pode levar a uma tomada de decisão mais informada.
Para saber mais sobre o papel da RPA na automação, consulte "A Arte da Automação: Capítulo 2 — Automação robótica de processos (RPA)".
Há fortes evidências de que há demanda para automatizar o processamento de documentos, de modo que a combinação de inteligência artificial (IA) com ferramentas de pouco código resultará na organização melhorando a produtividade dos colaboradores e impulsionando o desempenho.
Na verdade, trabalhando com nossos próprios clientes da IBM, descobrimos vários casos de uso nas quais o processamento inteligente de documentos pode ser aplicado. Discutiremos três exemplos de casos de uso abaixo e os possíveis benefícios que uma organização pode obter.
O processo de cotação e aprovação para o seguro comercial é muito competitivo, onde a primeira empresa a responder com uma cotação geralmente ganha o negócio. O desafio é que, em muitas seguradoras, esse processo exige avaliações manuais, entrada de dados de aplicação e leitura da documentação, dificultando a competição ou a escala. Isso também desvia o foco dos agentes dos serviços de consultoria, necessários para manter e expandir os negócios existentes. O processamento inteligente de documentos pode automatizar esse processo usando IA com deep learning para ler e classificar cada tipo de documento e extrair os dados apropriados desses diferentes formatos. Os dados extraídos podem, então, ser conectados a um fluxo de trabalho para acelerar o processamento de negócios para produzir a cotação e aprovar a solicitação.
Os três possíveis benefícios da aplicação do processamento inteligente de documentos são os seguintes:
A inscrição em dezenas de programas de governos locais (como assistência alimentar ou moradia subsidiada) exige processamento ineficiente e manual de planilhas, pois as equipes de TI não têm Recursos para criar as soluções necessárias. Usando ferramentas de pouco código e processamento inteligente de documentos, os usuários corporativos podem criar aplicações de processamento simples, mas adequadas à finalidade, e treinar o sistema para reconhecer campos-chave a partir de formulários de inscrição. Além disso, validadores fáceis de configurar podem garantir que campos de data e campos de moeda sejam reconhecidos com precisão, e validadores simples e personalizados também podem ser criados para lidar com campos únicos, como um número de previdência social.
Os três possíveis benefícios da aplicação do processamento inteligente de documentos são os seguintes:
Os bancos podem ter mais de 20 formulários diferentes de serviço à conta disponíveis para download em seu site. Os titulares de contas usam esses formulários para fazer alterações nas contas ou encerrar contas. Atualmente, isso pode exigir que uma equipe considerável de agentes leia esses formulários, verifique os dados e insira os dados em um sistema de gerenciamento de conta. No entanto, com ferramentas de pouco código e processamento inteligente de documentos, o banco pode criar rapidamente soluções para processar cada formulário de serviço de conta e usar o processamento inteligente de documentos para treinar o sistema em cada formulário, a fim de não apenas reconhecer campos comuns, como endereço do cliente e número da conta, mas também campos exclusivos para cada formulário.
Ao combinar com a RPA, o banco também pode pegar os dados extraídos e automatizar as alterações nos sistemas de back-end do banco. Além disso, aproveitando a classificação inteligente de documentos, os formulários de fechamento de conta podem ser sinalizados rapidamente e os agentes alertados sobre os clientes sobre possíveis riscos de voo.
Os três possíveis benefícios da aplicação do processamento inteligente de documentos são os seguintes:
A abordagem da IBM para superfícies inteligentes de processamento de documentos em nosso IBM Cloud Pak for Business Automation. Uma solução nativa da nuvem, o Automation Document Processing é um conjunto de serviços impulsionados por IA que lê e corrige automaticamente dados de documentos. Um projetista de processamento de documentos fornece uma interface no-code fácil de usar para treinar modelos sobre classificação de documentos, extração de dados e enriquecimento de dados.
Além disso, a IBM oferece modelos de solicitação de processamento de documentos que podem ser usados para processar documentos de página única ou lotes de documentos. Os toolkits no Application Designer podem ser usados também para personalizar a solicitação do usuário final para que ela tenha a mesma aparência de outras solicitações dentro da organização. Por fim, a IBM oferece ferramentas de implementação simples e uma integração pronta para uso com seus recursos de serviços de conteúdo, o IBM FileNet Content Manager, para armazenar os documentos e o arquivo de saída de dados.
Embora este capítulo tenha oferecido uma visão geral de como o processamento de documentos está sujeito a mudanças e onde a IA está desempenhando um papel importante no avanço do processamento de documentos, há mais inovação por vir nesse espaço. Há duas áreas principais, em particular, para ficar de olho. Primeiro, como os formatos e estruturas de documentos semiestruturados e não estruturados continuam explodindo, os modelos de IA precisarão acompanhar. Desde a leitura de estruturas de tabelas altamente complexas até o processamento de identificações emitidas pelo governo com hologramas ou marcas d'água, os modelos de IA serão desafiados a permanecer precisos.
Em segundo lugar, embora esse espaço tenha sido criado para o processamento inteligente de documentos, os tipos de arquivos de vídeo e áudio estão em ascensão. É apenas uma questão de tempo até que esses tipos de arquivos estejam no caminho crítico para o processamento de pedidos de seguros ou o arquivamento de relatórios policiais de incidentes.
Fique por perto; com certeza será emocionante.
Não deixe de conferir o podcast A Arte da Automação, especialmente o Episódio 7, no qual me sento com Jerry Cuomo para discutir o processamento inteligente de documentos.
Repense seus negócios com a IA e a IBM® Automation, deixando os sistemas de TI mais proativos, os processos mais eficientes e as pessoas mais produtivas.
A IBM garante a transformação de negócios para clientes corporativos com seus serviços de consultoria de automação extrema.
O IBM Cloud Pak for Business Automation é um conjunto modular de componentes de software integrados para gerenciamento e automação de operações.