Adição de extratores de documentos

Você pode adicionar extratores de documentos personalizados a fluxos de trabalho autênticos para extrair campos ou entidades, como data, nomes e outros, de documentos.

Ao configurar um extrator de documentos, você pode escolher um modelo da lista de modelos disponíveis. Você também pode adicionar seu próprio modelo personalizado por meio do AI Gateway. Para obter mais informações, consulte Adicionando modelos de IA por meio do AI Gateway.

Para adicionar um extrator de documentos a um fluxo de trabalho autêntico:

  1. Abra o fluxo de trabalho agênico no criador de fluxos de trabalho.

  2. Clique no ícone “Adicionar ícone de inclusãoitens de fluxo”.

  3. Selecione a guia Nós de fluxo.

  4. Arraste o extrator de documentos para o fluxo de trabalho autêntico.

  5. Selecione uma destas opções de ferramenta para extrair campos dos seus documentos: Estruturado ou Não estruturado. Para obter mais informações e orientações sobre qual opção de ferramenta é adequada para o seu caso de uso de extração de dados, consulte Escolhendo uma opção de ferramenta para extrair campos de documentos.

Como alternativa, para adicionar um extrator de documentos, clique na linha de conexão entre os nós inicial e final e selecione Adicionar uma atividade de fluxo > Extrator de documentos.

Escolhendo uma opção de ferramenta para extrair campos de documentos

Você pode escolher entre duas opções de ferramentas para extrair campos de documentos: Estruturado e Não estruturado. Essas ferramentas diferem na forma como processam as informações, mas os passos que você precisa seguir em ambas as opções são praticamente os mesmos.

  • Não estruturado : usa um modelo de linguagem baseado em texto para extrair campos de nível superior dos documentos. Funciona melhor para conteúdos com muito texto, mas não extrai valores de colunas de tabelas.

  • Estruturado : usa um modelo de linguagem multimodal baseado em visão para extrair campos de nível superior e dados de tabelas. Como depende de um modelo maior, geralmente funciona mais lentamente.

Quando usar cada opção da ferramenta

Configurando um extrator de documentos após selecionar a opção Não estruturado

Nota:

O modelo watsonx/ibm/granite-3-3-8b-instruct está obsoleto desde 24 de novembro de 2025 e será descontinuado em 22 de fevereiro de 2026. Use o modelo padrão ou outro modelo compatível para o extrator de documentos não estruturados.

Para configurar o extrator de documentos para identificar e extrair um conjunto de campos de documentos não estruturados:

  1. Selecione o extrator de documentos que você adicionou ao fluxo de trabalho autêntico.

  2. Clique no ícone "Editar editar campos".

  3. Selecione um modelo a ser usado para o extrator de documentos na lista Modelo.

    É exibida uma caixa de diálogo para carregar os documentos e adicionar campos.

    Na lista Modelos, clique em Exibir todos os modelos de fundação para abrir a caixa de diálogo de seleção de modelos, que lista todos os modelos disponíveis. Para selecionar um modelo, pesquise-o ou escolha um da lista. Depois de selecionar um modelo, clique em Salvar. São exibidos todos os avisos associados ao modelo selecionado, tais como avisos de descontinuação ou requisitos de licença de terceiros.

    Alguns modelos incluem uma etiqueta de status na caixa de diálogo para indicar estados como “Recomendado ” ou “De terceiros ”. Um ícone de aviso indica que um modelo pode ser retirado ou descontinuado em uma versão posterior.

    Nota:

    Você pode enviar documentos ou adicionar campos em qualquer ordem. A extração começa quando o sistema tem pelo menos um documento e um campo.

  4. Execute as ações a seguir:

    • Envie seus documentos

      Os documentos de amostra carregados ajudam a criar os campos. Esses documentos não treinam o modelo e também não fazem parte do agente que está sendo configurado.

      Pode levar algum tempo para carregar os documentos.

      Quando o upload estiver concluído, você verá uma visualização do documento, na qual poderá executar as seguintes ações usando as opções da barra de ferramentas:

      • Selecione um documento carregado para visualizar na lista

      • Navegue pelas páginas de um documento que você está visualizando

      • Ajuste a largura e a altura da página para visualização

      • Aumentar e diminuir o zoom de uma página para visualizar

      • Pesquisar um campo em um documento

      Exemplo de exibição de documentos carregados

      No exemplo anterior, um usuário faz upload de documentos de amostra e a visualização do documento é exibida para esses documentos.

    • Incluir campos

      Clique em “Adicionar campo” para adicionar campos para as informações que você deseja extrair dos documentos, como datas, nomes e outros.

      O extrator de documentos procura valores relacionados aos campos em todos os documentos.Figura 2: Exemplo que mostra os campos a serem extraídos de um documento.

      No exemplo anterior, um usuário adicionou os campos preço, prazo e data, que são pesquisados e exibidos no painel de visualização do documento.

      Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone editar Exibir detalhes do campo. Você pode editar o nome do campo, a descrição e o tipo de dados. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações deseja extrair e clicar em Mostrar no documento para obter os resultados. Você também pode excluir o campo se ele não for mais necessário.

  5. Para carregar mais documentos e excluir documentos existentes, selecione a opção Gerenciar documentos na lista da barra de ferramentas de visualização de documentos.

  6. Navegue pelos diferentes documentos na barra de ferramentas de visualização de documentos para verificar se as informações foram extraídas conforme o esperado.

  7. Configure as definições que acionam uma revisão do usuário. Para obter mais informações, consulte Configurando uma avaliação do usuário.

  8. Depois de verificar e obter os resultados esperados, feche a caixa de diálogo do extrator de documentos.

Configurando um extrator de documentos após selecionar a opção Estruturado

A capacidade de extrair todos os itens de documentos estruturados, como ordens de compra e faturas, reduz o trabalho manual e melhora a precisão no processamento de documentos.

Para configurar o extrator de documentos para identificar e extrair um conjunto de campos de documentos estruturados:

  1. Selecione o extrator de documentos que você adicionou ao fluxo de trabalho autêntico.

  2. Clique no ícone "Editar editar campos".

    É exibida uma caixa de diálogo para carregar os documentos e adicionar campos.
  3. Selecione ou especifique um modelo a ser usado pelo extrator de documentos na lista Modelos.

    Na lista Modelos, clique em Exibir todos os modelos de fundação para abrir a caixa de diálogo de seleção de modelos, que lista todos os modelos disponíveis. Para selecionar um modelo, pesquise-o ou escolha um da lista. Depois de selecionar um modelo, clique em Salvar. São exibidos todos os avisos associados ao modelo selecionado, tais como avisos de descontinuação ou requisitos de licença de terceiros.

    Alguns modelos incluem uma etiqueta de status na caixa de diálogo para indicar estados como “Recomendado ” ou “De terceiros ”. Um ícone de aviso indica que um modelo pode ser retirado ou descontinuado em uma versão posterior.

    Nota:

    Você pode enviar documentos ou adicionar campos em qualquer ordem. A extração começa quando o sistema tem pelo menos um documento e um campo.

  4. Execute as ações a seguir:
    • Use um esquema de uma lista de esquemas predefinidos

    Você pode selecionar um tipo de documento e adicionar vários campos associados a esse tipo, em vez de adicionar os campos manualmente, um por um. Estão disponíveis vários tipos de documentos, como extratos bancários, faturas, pedidos de indenização de seguros e outros, para a seleção de esquemas.

    Para adicionar campos de um esquema predefinido, faça o seguinte:
    1. Clique em Definir esquema.
    2. Selecione um tipo de documento em Esquemas predefinidos.

      É exibida uma descrição do tipo de documento selecionado e de todos os campos associados disponíveis para a extração de dados.

    3. Clique em Criar.

      O extrator de documentos procura valores relacionados aos campos em todos os documentos.Figura 3: Exemplo mostrando os campos de uma fatura.

    No exemplo anterior, os campos extraídos de um documento de fatura são exibidos na caixa de diálogo.

    Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone editar “Ver detalhes do campo”. Você pode editar o nome do campo, o tipo de dados e a descrição. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações deseja extrair e clicar em Mostrar no documento para obter os resultados. Você também pode excluir o campo, caso ele não seja necessário.

    • Envie seus documentos

    Os documentos de amostra carregados ajudam a criar os campos. Esses documentos não treinam o modelo e também não fazem parte do agente que está sendo configurado.

    Pode levar algum tempo para carregar os documentos.

    Quando o upload estiver concluído, você verá uma visualização do documento, na qual poderá executar as seguintes ações usando as opções da barra de ferramentas:

    • Selecione um documento carregado para visualizar na lista

    • Navegue pelas páginas de um documento que você está visualizando

    • Ajuste a largura e a altura da página para visualização

    • Aumentar e diminuir o zoom de uma página para visualizar

    • Pesquisar um campo em um documento

    Exemplo mostrando uma fatura carregada

    No exemplo anterior, um usuário carrega um documento de fatura de amostra e a pré-visualização do documento é exibida para o documento. A pré-visualização também mostra as tabelas detectadas automaticamente no documento, das quais você pode extrair dados.

    • Adicionar tabelas detectadas automaticamente

    Para adicionar uma tabela detectada automaticamente no documento para extrair dados, clique no ícone Adicionar adicionar_tabela tabela.

    Os dados da tabela são adicionados aos campos para extração sob um nome de tabela. Para editar o nome da tabela, passe o mouse sobre o nome da tabela e clique no ícone Editar editar. Para excluir a tabela, você pode clicar no ícone editarExcluir.

    Você também pode reordenar as colunas nas tabelas extraídas. Para obter mais informações, consulte Reordenar colunas.

    • Adicionar tabelas personalizadas

    Para adicionar uma tabela personalizada e definir os campos dos quais extrair dados, clique em “Definir esquema ”, selecione “Esquema definido pelo usuário ” e clique em “Criar ”.

    Faça o seguinte para adicionar uma tabela personalizada:

    a. Clique no ícone “Adicionar adicionar_tabela tabela” no painel lateral, especifique um nome para sua tabela personalizada e pressione Enter.

    b. Clique em Adicionar coluna, forneça o nome da coluna para sua tabela personalizada e pressione Enter. Repita esta etapa para adicionar mais colunas à sua tabela personalizada.

    O sistema procura os valores da coluna no documento. O primeiro valor encontrado para uma coluna é exibido no painel lateral e todos os outros valores dessa coluna são destacados na visualização do documento.

    Se um valor não for encontrado para uma coluna, nenhum valor será exibido no painel lateral da coluna. Nesse caso, você pode clicar no ícone “Exibir visualizar detalhes da coluna detalhes da coluna” para solicitar ao sistema o valor esperado no documento. Essa ação ajuda o sistema a entender quais informações você deseja extrair para a coluna.

    Para solicitar um valor, selecione o tipo de dados, ative a opção Descrição e insira ou descreva o valor e, em seguida, clique em Mostrar no documento. O sistema procura os valores no documento com base na sua descrição. Se um valor for encontrado, ele será exibido no painel lateral. Você também pode excluir a coluna se ela não for mais necessária.

    Você também pode reordenar as colunas nas tabelas extraídas. Para obter mais informações, consulte Reordenar colunas.

    c. Para visualizar sua tabela personalizada com uma pré-visualização dos dados extraídos, clique em Exibir ao lado do nome da tabela.

    Exemplo mostrando uma tabela personalizada com as colunas

    • Incluir campos

    Para adicionar mais campos para as informações que você deseja extrair dos documentos, como datas, nomes e outros, clique em Definir esquema, selecione Esquema definido pelo usuário e clique em Criar -> Adicionar campo.

    Depois que você digita o nome de um campo, o extrator de documentos procura valores relacionados a esses campos em todos os documentos.

    Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone "Exibir detalhes editar do campo". Você pode editar o nome do campo, o tipo de dados e a descrição. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações deseja extrair e clicar em Mostrar no documento para obter os resultados. Você também pode excluir o campo se ele não for mais necessário.

  5. Para enviar mais documentos e excluir os já existentes, clique no ícone “Gerenciar gerenciar-documentodocumentos” na lista da barra de ferramentas de visualização de documentos.

  6. Navegue pelos diferentes documentos na barra de ferramentas de visualização de documentos para verificar se as informações foram extraídas conforme o esperado.

  7. Configure as definições que acionam uma revisão do usuário. Para obter mais informações, consulte Configurando uma avaliação do usuário.

  8. Depois de verificar e obter os resultados esperados, feche a caixa de diálogo do extrator de documentos.

Reordenando colunas

Você pode reordenar as colunas nas tabelas arrastando-as e soltando-as. Essa ação é útil, por exemplo, quando você deseja garantir que a ordem das colunas esteja alinhada com a tabela original no documento.

Por padrão, a ordem das colunas no esquema corresponde à ordem na tabela extraída. No entanto, se uma coluna for omitida durante a detecção automática e for adicionada manualmente posteriormente, ela aparecerá no final da tabela.

Para reordenar os nomes das colunas nas tabelas:

  1. Passe o mouse sobre o nome da coluna no painel lateral e arraste-a clicando no ícone de arrastararrastar.

  2. Clique em Exibir ao lado do nome da tabela. A nova ordem das colunas na tabela é exibida na pré-visualização.

Mapeamento de dados para entradas

Por padrão, o mapeamento automático está ativado. No entanto, você pode mapear valores para as entradas.

Para mapear valores para entradas, conclua as etapas a seguir:

  1. Selecione o nó do extrator de documentos e clique em Editar mapeamento de dados.

  2. Especifique os valores de entrada para o mapeamento de dados. Para obter mais informações sobre o mapeamento de dados, consulte Mapeamento de dados.

Tabelas de mapeamento extraídas de um nó extrator de documentos para outros nós em um fluxo de trabalho

Agora você pode mapear uma saída do tipo tabela a partir de um nó extrator de documentos em um fluxo de trabalho. Você pode fazer qualquer uma das seguintes opções:

  • Para exibir a tabela inteira em um chat, mapeie a tabela extraída no fluxo de trabalho usando o tipo de interação de lista em um nó extrator de documentos.

Exemplo mostrando um mapeamento de tabela personalizado usando uma lista em um extrator de documentos

  • Para exibir os dados das linhas de uma tabela em um chat, você pode iterar pelas linhas de uma tabela extraída usando um loop For each no fluxo de trabalho. Para fazer isso, você pode combinar um loop For each com um nó de atividade do usuário e uma saída de mensagem. Em seguida, para exibir cada linha, você pode selecionar as colunas no mapeamento de dados do loop Para cada.

Exemplo mostrando o mapeamento de dados das colunas em um loop For each

Além disso, para usar qualquer saída de tabela extraída em um nó posterior no fluxo de trabalho, você pode usar esse mesmo processo de mapeamento de dados do loop For each. Isso permite um processamento adicional, como a aplicação de lógica condicional em um fluxo de trabalho.

Configurando uma avaliação do usuário

Você pode configurar as definições que acionam uma revisão do usuário.

Se a pontuação de confiança da extração do sistema for inferior ao limite de confiança de extração definido (para a opção não estruturada ) ou quando a extração retornar valores vazios (para a opção estruturada ), uma tarefa de revisão do usuário é criada e atribuída ao usuário.

Para configurar uma avaliação do usuário:

  1. Selecione o extrator de documentos no fluxo de trabalho autêntico.

  2. Ative a opção Revisão do usuário.

  3. Faça o seguinte:

    • Para a opção não estruturada : clique no ícone Editar Editar ícone no campo “Se a confiança da extração estiver abaixo de ”. Defina o limite de confiança de extração para todos os campos ou campos específicos que podem acionar uma revisão do usuário. Para selecionar campos específicos que acionam uma revisão do usuário, clique no ícone Editar Editar ícone, selecione os campos específicos e clique em Concluído. A pontuação de confiança da extração reflete a proximidade com que os resultados extraídos correspondem aos valores esperados.

    • Para a opção estruturada : clique no ícone Editar Editar ícone no campo “Se a extração retornar valores vazios ”.

      1. Na lista Atribuir a, selecione uma destas opções:

Opção

Descrição

Iniciador de fluxo

Apenas o usuário que inicia o fluxo pode revisar o documento.

Usuário especificado

Apenas um usuário específico pode revisar o document.If. Como nenhum usuário está atribuído, clique em “Atribuir usuário” para selecionar um usuário. O usuário selecionado é exibido no campo “Usuário atribuído ”. Para alterar o usuário, clique no ícone Editar Editar ícone e selecione outro usuário.

Usuário a partir de uma variável

Somente um usuário especificado em uma variável pode revisar o documento.

O sistema notifica o usuário no chat que é necessária uma revisão, dependendo da pontuação de confiança da extração ou de valores vazios.

Exemplo mostrando uma notificação de tarefa de avaliação do usuário no chat

O usuário pode clicar na notificação do chat para visualizar a atividade de revisão.

Exemplo mostrando uma tarefa de avaliação do usuário no chat

O usuário pode então examinar os valores extraídos, fazer as alterações necessárias e enviar a revisão. Após o envio, o fluxo de trabalho continua com os valores atualizados.

Exemplo mostrando avaliação do usuário

Limites e restrições do extrator de documentos

Os extratores de documentos têm os seguintes limites e restrições.

Área

Descrição

Tamanho máximo do arquivo

10 MB

Número máximo de arquivos carregados

5 arquivos

Tipos de arquivos aceitos

.doc,.docx,.jpe,.jpeg,.jpg,.pdf,.png,.ppt,.pptx,.tif,.tiff

número máximo de páginas

600 páginas

Número máximo de campos

25 campos

As seguintes limitações também se aplicam ao extrator de documentos:

  • Valores de confiança para campos extraídos

O extrator de documentos estruturados não fornece pontuações de confiança para os valores dos campos extraídos, ao contrário do extrator de documentos não estruturados. Portanto, as regras de avaliação do usuário baseadas na confiança não podem ser configuradas.

  • Extração de menção única

O extrator de documentos captura apenas uma instância de um valor de campo em um documento, geralmente a primeira ocorrência. Por exemplo, se um número de fatura aparecer várias vezes, apenas uma instância será extraída. Para capturar vários valores, defina campos com rótulos semânticos distintos, como número de telefone residencial e número de telefone celular.

Criação de fluxos de trabalho autônomos

Um fluxo de trabalho agêntico define um conjunto de atividades e controles vinculados que são projetados para atingir um objetivo ou meta comercial específico. Saiba mais sobre fluxos de trabalho agênticos.