Introdução ao processamento de documentos
Neste tópico, são apresentados o watsonx Orchestrate processamento de documentos e suas capacidades. As informações contidas neste tópico destinam-se a novos usuários, para ajudá-los a compreender os recursos de maneira eficaz. Você aprenderá a configurar agentes que podem classificar documentos, extrair campos de documentos (como contratos e faturas) e testar como os dados extraídos são exibidos aos usuários em um chat.
O fluxo de trabalho começa com a configuração do classificador de documentos para identificar o tipo de documento inserido. Com base nos resultados da classificação, os dados são extraídos dos documentos. O fluxo de trabalho termina após os campos extraídos serem exibidos aos usuários.
Criando um agente para processamento de documentos
Vamos começar criando um novo agente do zero, em vez de usar modelos pré-configurados.
Para criar um agente:
No menu
Em um ambient IBM Cloud, selecione um espaço de trabalho na lista de espaços de trabalho ou crie um espaço de trabalho para o seu agente., vá até “Compilar ”.
Selecione Todos os agentes e clique em Criar agente.
Selecione Criar do zero.
Insira um nome significativo para o seu agente, como Demo_Processamento_de_Documentos.
Insira uma descrição para o seu agente, como “Este agente classifica documentos e extrai dados de documentos ”. Para aprender a escrever uma boa descrição para o seu agente, clique em O que torna uma descrição boa? opção.
Clique em Criar.
A página onde você pode configurar e testar seu novo agente é exibida.

A tela possui três áreas principais:
Painel de navegação: navegue entre as seções do criador de agentes, como Perfil, Conhecimento e outras.
Painel de configurações: defina e configure as funções do seu agente.
Painel de pré-visualização: teste o agente e ajuste as configurações para melhorar a experiência do usuário.
Para obter mais informações sobre como criar agentes, consulte Criação de agentes.
Adicionando as ferramentas de processamento de documentos ao agente
No painel de navegação, você pode adicionar ferramentas ao agente. Criaremos um fluxo de trabalho agênico a partir do zero e adicionaremos ferramentas de processamento de documentos ao fluxo de trabalho.
Para adicionar o fluxo de trabalho ao agente:
No painel de navegação, clique em Conjunto de ferramentas.
Clique em Adicionar ferramenta no painel de configurações.
Selecione o fluxo de trabalho Agentic.
Insira um nome significativo para o fluxo de trabalho. Chamaremos o fluxo de trabalho de Demonstração de processamento de documentos.
Clique em Começar a construir. A página do fluxo de trabalho é exibida com os nós inicial e final.
Agora, vamos adicionar uma descrição para o novo fluxo de trabalho e especificar quaisquer entradas e saídas para o fluxo de trabalho.
Nomear e definir as entradas e saídas
As descrições explicam o que cada ferramenta faz e como usá-la, mas não afetam o funcionamento da ferramenta. Para ajudar os agentes de IA a escolherem efetivamente a ferramenta certa para auxiliar os usuários, siga estas diretrizes ao escrever descrições:
Especifique o que a ferramenta faz e as tarefas específicas que ela suporta. Indique claramente suas capacidades e quaisquer limitações.
Explique quando usar a ferramenta. Inclua palavras-chave relevantes, ações do usuário ou tipos de solicitação.
Descreva as situações ou solicitações do usuário que ativam essa ferramenta. Concentre-se na intenção ou nas palavras-chave que indicam quando a ferramenta é relevante. Isso ajuda o agente a decidir o momento certo para chamar a ferramenta.
Se a ferramenta funcionar com outras ferramentas ou agentes, explique como eles interagem e quando usá-los juntos.
As entradas e saídas são essenciais nos fluxos de trabalho de agentes, pois definem como os dados entram e saem do fluxo de trabalho. Elas se aplicam a todo o fluxo de trabalho. As entradas fornecem as informações iniciais necessárias para o fluxo de trabalho ou permitem que o fluxo de trabalho comece com contexto. As saídas fornecem o resultado final ou dados estruturados após a conclusão do fluxo de trabalho. Eles tornam o fluxo de trabalho útil, retornando resultados significativos.
No exemplo do agente Demo_Document_Processing, adicionaremos uma descrição e um parâmetro de saída.
Para adicionar uma descrição e um parâmetro de saída:
Na página de fluxo de trabalho, clique em Editar detalhes.
Para este fluxo de trabalho de exemplo, insira a descrição Este fluxo de trabalho classifica e extrai valores de documentos.
Clique na guia Parâmetros para especificar um parâmetro de saída para este fluxo de trabalho. Não precisamos especificar nenhum parâmetro de entrada, pois os documentos serão carregados pelo usuário no fluxo de trabalho durante um chat.
Clique em Adicionar saída e selecione string.
No campo Nome, insira class_name e, em Descrição, insira Este parâmetro fornece o resultado da classificação do documento.
Clique em Incluir.
Clique em Pronto.
Agora fornecemos uma descrição para a ferramenta e também adicionamos um parâmetro de saída.
Agora, para coletar o documento para ingestão, adicione um nó de atividade do usuário ao fluxo de trabalho ou o nó classificador de documentos que criaremos posteriormente poderá solicitar ao usuário que faça o upload de um arquivo.
Adicionar uma atividade de usuário para coletar documentos (opcional)
Para adicionar um nó de atividade do usuário ao fluxo de trabalho:
Passe o mouse sobre a linha de conexão entre os nós inicial e final.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Atividade do usuário ”.Queremos que os usuários enviem arquivos, então vamos adicionar um tipo de interação de envio de arquivo à atividade do usuário.
No nó de atividade do usuário, clique em Adicionar e selecione Coletar do usuário > Upload de arquivo.
O nó de atividade do usuário com a interação de upload de arquivo é adicionado ao fluxo de trabalho.

A próxima etapa após o usuário enviar um documento é classificá-lo.
Classificação dos documentos enviados
Para classificar o documento carregado, vamos adicionar um nó classificador de documentos ao fluxo de trabalho. Um classificador de documentos pode identificar automaticamente o tipo de documento. Você pode definir as classes de documentos, como faturas e contratos, e o classificador usa IA para categorizar os documentos com base nessas classes.
Para adicionar um classificador de documentos ao fluxo de trabalho:
Passe o mouse sobre a linha de conexão entre a atividade do usuário e os nós finais.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Classificador de documentos ”.Clique no nó Classificador de documentos, clique em Adicionar classe e adicione duas classes de documentos para este fluxo de trabalho de exemplo: Contrato e Fatura.
O classificador de documentos com as classes especificadas é adicionado ao fluxo de trabalho.

Agora, vamos testar este nó classificador de documentos para garantir que ele é capaz de classificar os documentos conforme o esperado.
Para testar este classificador de documentos:
Selecione o classificador de documentos no fluxo de trabalho.
Selecione Classificador de teste e carregue um documento de contrato e um documento de fatura.
Para este fluxo de trabalho de exemplo, estamos usando um contrato simples e um documento de fatura. Da mesma forma, você pode carregar qualquer um dos seus documentos de contrato e fatura para testar o classificador.
O upload dos documentos pode demorar algum tempo. Após o processamento dos seus documentos, você poderá ver a classificação prevista para cada um deles. Os documentos que não correspondem às classes definidas são classificados como Outros.
Após o processamento dos documentos, o classificador de documentos prevê o tipo de documento como contrato ou fatura.

Depois de obter os resultados previstos, clique em Concluído na caixa de diálogo do classificador de documentos.
Para obter mais informações sobre o classificador de documentos, consulte Adicionando classificadores de documentos.
Nosso fluxo de trabalho de exemplo agora pode classificar um documento enviado pelo usuário. Então, a seguir, adicionaremos uma ramificação ao fluxo de trabalho para verificar o tipo de documento.
Adicionar um ramo para verificar o tipo de documento
A filial pode decidir qual caminho seguir em um fluxo de trabalho com base em uma condição. Usamos uma ramificação neste fluxo de trabalho de exemplo para seguir dois caminhos: um para extrair dados de contratos e outro para extrair dados de faturas.
Para adicionar um ramo ao fluxo de trabalho:
Passe o mouse sobre a linha de conexão entre o classificador de documentos e os nós finais.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Ramificação ”.Clique no ramo para definir as condições do caminho. Você pode definir condições de caminho usando o criador de condições ou o editor de expressões. Ao criar uma ramificação, dois caminhos são gerados por padrão, mas você pode adicionar caminhos adicionais.
Para definir a condição do caminho, usamos o criador de condições neste exemplo.
Para o Caminho 1, clique em Editar condição.
Clique no ícone
de mais, selecione o nó “Classificador de documentos ” e, em seguida, selecione a class_namesaída.Selecione o
==operador e, para o valor, insira Contrato.Quando o
class_namevalor for Contrato, o fluxo de trabalho seguirá agora o Caminho 1. Você só precisa definir a condição para o Caminho 1, pois o fluxo de trabalho seguirá o Caminho 2 por padrão quando oclass_namevalor não for Contrato.

Agora, o fluxo de trabalho de exemplo pode processar um documento e verificar seu tipo de saída. Em seguida, podemos adicionar os extratores de documentos ao fluxo de trabalho para extrair detalhes do contrato e da fatura.
Incorporar extratores de documentos para extrair dados
Os extratores de documentos podem extrair campos ou entidades, como datas, nomes e outros, dos documentos.
Para adicionar um extrator de documentos ao Caminho 1 para extrair dados do contrato:
Passe o mouse sobre a linha de conexão do Caminho 1 entre o nó de ramificação e o nó final.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Extrator de documentos ”.Selecione Não estruturado.
Clique no ícone "Editar
campos" e altere o nome para "Extrator de contratos".Use o watsonx/meta-llama/llama-3-2-11b-vision-instruct modelo na lista de modelos. No entanto, você pode alterar o modelo a qualquer momento e selecionar aquele que for mais preciso para extrair dados.
Carregue um documento de contrato de amostra.
O documento de amostra carregado ajuda na criação dos campos a serem extraídos. O documento não treina o modelo e também não faz parte do agente que está sendo configurado.
O upload do documento pode demorar algum tempo. Quando o upload estiver concluído, você poderá ver uma pré-visualização do documento.
Clique em Adicionar campo para adicionar campos para as informações a serem extraídas dos documentos, como comprador, fornecedor, data e outros.

No exemplo anterior, os campos pessoal, data de vigência, fornecedor e comprador são adicionados, pesquisados e exibidos no painel de visualização do documento.
Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone "Exibir detalhes
do campo". Você pode editar o nome do campo, a descrição e o tipo de dados. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações você deseja extrair.
Da mesma forma, adicione um extrator de documentos ao Caminho 2 para extrair dados de faturas:
Passe o mouse sobre a linha de conexão do Caminho 2 entre o nó de ramificação e o nó final.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Extrator de documentos ”.Selecione Não estruturado.
Clique no ícone "Editar
campos" e altere o nome para "Extrator de faturas".Use o watsonx/meta-llama/llama-3-2-11b-vision-instruct modelo na lista de modelos. No entanto, você pode alterar o modelo a qualquer momento e selecionar aquele que for mais preciso para extrair dados.
Carregue um documento de fatura de amostra.
Clique em Adicionar campo para adicionar campos para as informações a serem extraídas dos documentos, como comprador, fornecedor, data e outros.

No exemplo anterior, endereço, item, quantidade e outros campos são adicionados, os quais são pesquisados e exibidos no painel de visualização do documento.
Para obter mais informações, como por exemplo sobre como gerenciar documentos enviados, adicionar exemplos para campos e outras opções, consulte Adicionando extratores de documentos.
Agora, o fluxo de trabalho pode extrair dados de contratos e faturas dos documentos carregados. Em seguida, adicionaremos um nó de atividade do usuário para exibir os resultados aos usuários. Esta etapa permite exibir os resultados, com base nos campos extraídos, que definimos para cada tipo de documento.
Exibição dos dados extraídos aos usuários
Adicionaremos dois nós de atividade do usuário ao fluxo de trabalho. Um nó para exibir os dados do contrato extraídos e outro para exibir os dados da fatura extraídos.
Para adicionar um nó de atividade do usuário para exibir os dados do contrato:
Passe o mouse sobre a linha de conexão entre o nó extrator de contrato e o nó final.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Atividade do usuário ”.No nó de atividade do usuário, clique em Adicionar e selecione Exibir para o usuário > Mensagem.
O nó de atividade do usuário com a interação da mensagem é adicionado ao fluxo de trabalho. Renomeie a interação da mensagem para Exibir detalhes do contrato.
Clique no nó da mensagem e adicione variáveis do nó extrator de contrato para exibir os dados extraídos.

Para adicionar um nó de atividade do usuário para exibir os dados da fatura:
Passe o mouse sobre a linha de conexão entre o nó extrator de faturas e o nó final.
Clique no ícone
“Adicionar itens de fluxo” e selecione “Nós de fluxo” > “Atividade do usuário ”.No nó de atividade do usuário, clique em Adicionar e selecione Exibir para o usuário > Mensagem.
O nó de atividade do usuário com a interação da mensagem é adicionado ao fluxo de trabalho. Renomeie a interação da mensagem para Exibir detalhes da fatura.
Clique no nó da mensagem e adicione variáveis do nó extrator de faturas para exibir os dados extraídos.

Agora que o fluxo de trabalho pode exibir a saída para os usuários, podemos concluir o fluxo atualizando o nó final.
Definindo o nó final
Atualizaremos o nó final para usar o parâmetro de saída class_name que definimos no início do tópico.
Para atualizar o nó final:
Clique no nó final e selecione Editar mapeamento de dados.
Você pode ver que o mapeamento automático já está aplicado ao parâmetro class_name. Neste caso, definimos apenas um parâmetro de saída para o fluxo de trabalho no início, portanto, o mapeamento automático funciona bem. Para fluxos de trabalho mais complexos, como quando há dois parâmetros class_name, você pode usar o mapeamento explícito de variáveis para lidar com eles.
Por exemplo, se você quiser mapear explicitamente o parâmetro class_name em vez de usar o mapeamento automático, clique no ícone Variável
e selecione o parâmetro class_name no nó Classificador de documentos.Se você seguiu as etapas deste tópico, seu fluxo de trabalho será semelhante ao da imagem a seguir:

Clique em Pronto para salvar suas mudanças. A página onde você pode configurar e testar seu novo agente é exibida.
Adicionar um comportamento ao seu agente
Para acionar o agente correto, você deve definir as instruções na seção Comportamento do seu novo agente.
Para adicionar um comportamento ao seu novo agente:
No painel de navegação da página, clique em Comportamento.
Defina como e onde seu novo agente deve reagir às solicitações e responder aos usuários. Por exemplo, para este agente, você pode inserir Invocar a ferramenta Demo_Document_Processing e gerar o resultado.
Agora, você pode testar seu novo agente enviando documentos.
Testando seu agente
Para acionar seu agente para teste:
Digite Invoke the Demo_Document_Processing tool no painel de visualização e pressione Enter.
Carregue o documento do seu contrato. Você também pode repetir o teste enviando um documento de fatura.
Depois de enviar seu documento, o agente executa automaticamente as etapas do fluxo de trabalho em segundo plano. Ele extrai os dados relevantes com base nos campos especificados e gera uma resposta contendo as informações extraídas. Além disso, fornece informações sobre a classificação do documento.
Seus resultados devem ser semelhantes aos da imagem a seguir:

Esta seção conclui a criação de um agente do zero, a configuração do agente para classificar documentos, a extração de campos dos documentos e o teste do agente para ver como os dados extraídos são exibidos aos usuários em um chat.