Adição de extratores de documentos
Você pode adicionar extratores de documentos personalizados a fluxos de trabalho autênticos para extrair campos ou entidades, como data, nomes e outros, de documentos.
Ao configurar um extrator de documentos, você pode escolher um modelo da lista de modelos disponíveis. Você também pode adicionar seu próprio modelo personalizado por meio do AI Gateway. Para obter mais informações, consulte Adicionando modelos de IA por meio do AI Gateway.
Para adicionar um extrator de documentos a um fluxo de trabalho autêntico:
Abra o fluxo de trabalho agênico no criador de fluxos de trabalho.
Clique no ícone “Adicionar
itens de fluxo”.Selecione a guia Nós de fluxo.
Arraste o extrator de documentos para o fluxo de trabalho autêntico.
Selecione uma destas opções de ferramenta para extrair campos dos seus documentos: Estruturado ou Não estruturado. Para obter mais informações e orientações sobre qual opção de ferramenta é adequada para o seu caso de uso de extração de dados, consulte Escolhendo uma opção de ferramenta para extrair campos de documentos.
Como alternativa, para adicionar um extrator de documentos, clique na linha de conexão entre os nós inicial e final e selecione Adicionar uma atividade de fluxo > Extrator de documentos.
Escolhendo uma opção de ferramenta para extrair campos de documentos
Você pode escolher entre duas opções de ferramentas para extrair campos de documentos: Estruturado e Não estruturado. Essas ferramentas diferem na forma como processam as informações, mas os passos que você precisa seguir em ambas as opções são praticamente os mesmos.
Não estruturado : usa um modelo de linguagem baseado em texto para extrair campos de nível superior dos documentos. Funciona melhor para conteúdos com muito texto, mas não extrai valores de colunas de tabelas.
Estruturado : usa um modelo de linguagem multimodal baseado em visão para extrair campos de nível superior e dados de tabelas. Como depende de um modelo maior, geralmente funciona mais lentamente.
Quando usar cada opção da ferramenta
Use Não estruturado para documentos com muito texto que abrangem várias páginas, como contratos, e-mails ou manuais, nos quais os campos aparecem nos cabeçalhos ou no corpo do texto. Para obter mais informações, consulte Configurando um extrator de documentos após selecionar a opção Não estruturado.
Use o formato Estruturado para documentos estruturados ou com layout fixo, normalmente com uma a três páginas, como faturas, ordens de compra ou formulários fiscais. É ideal quando você precisa extrair informações de tabelas. Para obter mais informações, consulte Configurando um extrator de documentos após selecionar a opção Estruturado.
Configurando um extrator de documentos após selecionar a opção Não estruturado
O modelo watsonx/ibm/granite-3-3-8b-instruct está obsoleto desde 24 de novembro de 2025 e será descontinuado em 22 de fevereiro de 2026. Use o modelo padrão ou outro modelo compatível para o extrator de documentos não estruturados.
Para configurar o extrator de documentos para identificar e extrair um conjunto de campos de documentos não estruturados:
Selecione o extrator de documentos que você adicionou ao fluxo de trabalho autêntico.
Clique no ícone "Editar
campos".- Selecione um modelo a ser usado para o extrator de documentos na lista Modelo.
É exibida uma caixa de diálogo para carregar os documentos e adicionar campos.
Na lista Modelos, clique em Exibir todos os modelos de fundação para abrir a caixa de diálogo de seleção de modelos, que lista todos os modelos disponíveis. Para selecionar um modelo, pesquise-o ou escolha um da lista. Depois de selecionar um modelo, clique em Salvar. São exibidos todos os avisos associados ao modelo selecionado, tais como avisos de descontinuação ou requisitos de licença de terceiros.
Alguns modelos incluem uma etiqueta de status na caixa de diálogo para indicar estados como “Recomendado ” ou “De terceiros ”. Um ícone de aviso indica que um modelo pode ser retirado ou descontinuado em uma versão posterior.
Nota:Você pode enviar documentos ou adicionar campos em qualquer ordem. A extração começa quando o sistema tem pelo menos um documento e um campo.
Execute as ações a seguir:
Envie seus documentos
Os documentos de amostra carregados ajudam a criar os campos. Esses documentos não treinam o modelo e também não fazem parte do agente que está sendo configurado.
Pode levar algum tempo para carregar os documentos.
Quando o upload estiver concluído, você verá uma visualização do documento, na qual poderá executar as seguintes ações usando as opções da barra de ferramentas:
Selecione um documento carregado para visualizar na lista
Navegue pelas páginas de um documento que você está visualizando
Ajuste a largura e a altura da página para visualização
Aumentar e diminuir o zoom de uma página para visualizar
Pesquisar um campo em um documento

No exemplo anterior, um usuário faz upload de documentos de amostra e a visualização do documento é exibida para esses documentos.
- Incluir campos
Clique em “Adicionar campo” para adicionar campos para as informações que você deseja extrair dos documentos, como datas, nomes e outros.
O extrator de documentos procura valores relacionados aos campos em todos os documentos.

No exemplo anterior, um usuário adicionou os campos preço, prazo e data, que são pesquisados e exibidos no painel de visualização do documento.
Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone
Exibir detalhes do campo. Você pode editar o nome do campo, a descrição e o tipo de dados. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações deseja extrair e clicar em Mostrar no documento para obter os resultados. Você também pode excluir o campo se ele não for mais necessário.
Para carregar mais documentos e excluir documentos existentes, selecione a opção Gerenciar documentos na lista da barra de ferramentas de visualização de documentos.
Navegue pelos diferentes documentos na barra de ferramentas de visualização de documentos para verificar se as informações foram extraídas conforme o esperado.
Configure as definições que acionam uma revisão do usuário. Para obter mais informações, consulte Configurando uma avaliação do usuário.
Depois de verificar e obter os resultados esperados, feche a caixa de diálogo do extrator de documentos.
Configurando um extrator de documentos após selecionar a opção Estruturado
A capacidade de extrair todos os itens de documentos estruturados, como ordens de compra e faturas, reduz o trabalho manual e melhora a precisão no processamento de documentos.
Para configurar o extrator de documentos para identificar e extrair um conjunto de campos de documentos estruturados:
Selecione o extrator de documentos que você adicionou ao fluxo de trabalho autêntico.
Clique no ícone "Editar
É exibida uma caixa de diálogo para carregar os documentos e adicionar campos.
campos".- Selecione ou especifique um modelo a ser usado pelo extrator de documentos na lista Modelos.
Na lista Modelos, clique em Exibir todos os modelos de fundação para abrir a caixa de diálogo de seleção de modelos, que lista todos os modelos disponíveis. Para selecionar um modelo, pesquise-o ou escolha um da lista. Depois de selecionar um modelo, clique em Salvar. São exibidos todos os avisos associados ao modelo selecionado, tais como avisos de descontinuação ou requisitos de licença de terceiros.
Alguns modelos incluem uma etiqueta de status na caixa de diálogo para indicar estados como “Recomendado ” ou “De terceiros ”. Um ícone de aviso indica que um modelo pode ser retirado ou descontinuado em uma versão posterior.
Nota:Você pode enviar documentos ou adicionar campos em qualquer ordem. A extração começa quando o sistema tem pelo menos um documento e um campo.
- Execute as ações a seguir:
- Use um esquema de uma lista de esquemas predefinidos
Você pode selecionar um tipo de documento e adicionar vários campos associados a esse tipo, em vez de adicionar os campos manualmente, um por um. Estão disponíveis vários tipos de documentos, como extratos bancários, faturas, pedidos de indenização de seguros e outros, para a seleção de esquemas.
Para adicionar campos de um esquema predefinido, faça o seguinte:- Clique em Definir esquema.
- Selecione um tipo de documento em Esquemas predefinidos.
É exibida uma descrição do tipo de documento selecionado e de todos os campos associados disponíveis para a extração de dados.
- Clique em Criar.
O extrator de documentos procura valores relacionados aos campos em todos os documentos.

No exemplo anterior, os campos extraídos de um documento de fatura são exibidos na caixa de diálogo.
Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone
“Ver detalhes do campo”. Você pode editar o nome do campo, o tipo de dados e a descrição. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações deseja extrair e clicar em Mostrar no documento para obter os resultados. Você também pode excluir o campo, caso ele não seja necessário.Envie seus documentos
Os documentos de amostra carregados ajudam a criar os campos. Esses documentos não treinam o modelo e também não fazem parte do agente que está sendo configurado.
Pode levar algum tempo para carregar os documentos.
Quando o upload estiver concluído, você verá uma visualização do documento, na qual poderá executar as seguintes ações usando as opções da barra de ferramentas:
Selecione um documento carregado para visualizar na lista
Navegue pelas páginas de um documento que você está visualizando
Ajuste a largura e a altura da página para visualização
Aumentar e diminuir o zoom de uma página para visualizar
Pesquisar um campo em um documento

No exemplo anterior, um usuário carrega um documento de fatura de amostra e a pré-visualização do documento é exibida para o documento. A pré-visualização também mostra as tabelas detectadas automaticamente no documento, das quais você pode extrair dados.
Adicionar tabelas detectadas automaticamente
Para adicionar uma tabela detectada automaticamente no documento para extrair dados, clique no ícone Adicionar
tabela.Os dados da tabela são adicionados aos campos para extração sob um nome de tabela. Para editar o nome da tabela, passe o mouse sobre o nome da tabela e clique no ícone Editar
. Para excluir a tabela, você pode clicar no ícone
Excluir.Você também pode reordenar as colunas nas tabelas extraídas. Para obter mais informações, consulte Reordenar colunas.
Adicionar tabelas personalizadas
Para adicionar uma tabela personalizada e definir os campos dos quais extrair dados, clique em “Definir esquema ”, selecione “Esquema definido pelo usuário ” e clique em “Criar ”.
Faça o seguinte para adicionar uma tabela personalizada:
a. Clique no ícone “Adicionar
tabela” no painel lateral, especifique um nome para sua tabela personalizada e pressione Enter.b. Clique em Adicionar coluna, forneça o nome da coluna para sua tabela personalizada e pressione Enter. Repita esta etapa para adicionar mais colunas à sua tabela personalizada.
O sistema procura os valores da coluna no documento. O primeiro valor encontrado para uma coluna é exibido no painel lateral e todos os outros valores dessa coluna são destacados na visualização do documento.
Se um valor não for encontrado para uma coluna, nenhum valor será exibido no painel lateral da coluna. Nesse caso, você pode clicar no ícone “Exibir
detalhes da coluna” para solicitar ao sistema o valor esperado no documento. Essa ação ajuda o sistema a entender quais informações você deseja extrair para a coluna.Para solicitar um valor, selecione o tipo de dados, ative a opção Descrição e insira ou descreva o valor e, em seguida, clique em Mostrar no documento. O sistema procura os valores no documento com base na sua descrição. Se um valor for encontrado, ele será exibido no painel lateral. Você também pode excluir a coluna se ela não for mais necessária.
Você também pode reordenar as colunas nas tabelas extraídas. Para obter mais informações, consulte Reordenar colunas.
c. Para visualizar sua tabela personalizada com uma pré-visualização dos dados extraídos, clique em Exibir ao lado do nome da tabela.

Incluir campos
Para adicionar mais campos para as informações que você deseja extrair dos documentos, como datas, nomes e outros, clique em Definir esquema, selecione Esquema definido pelo usuário e clique em Criar -> Adicionar campo.
Depois que você digita o nome de um campo, o extrator de documentos procura valores relacionados a esses campos em todos os documentos.
Para editar os detalhes do campo, passe o mouse sobre o campo e clique no ícone "Exibir detalhes
do campo". Você pode editar o nome do campo, o tipo de dados e a descrição. Você pode adicionar exemplos do campo para ajudar o modelo a entender quais informações deseja extrair e clicar em Mostrar no documento para obter os resultados. Você também pode excluir o campo se ele não for mais necessário. Para enviar mais documentos e excluir os já existentes, clique no ícone “Gerenciar
documentos” na lista da barra de ferramentas de visualização de documentos.Navegue pelos diferentes documentos na barra de ferramentas de visualização de documentos para verificar se as informações foram extraídas conforme o esperado.
Configure as definições que acionam uma revisão do usuário. Para obter mais informações, consulte Configurando uma avaliação do usuário.
Depois de verificar e obter os resultados esperados, feche a caixa de diálogo do extrator de documentos.
Reordenando colunas
Você pode reordenar as colunas nas tabelas arrastando-as e soltando-as. Essa ação é útil, por exemplo, quando você deseja garantir que a ordem das colunas esteja alinhada com a tabela original no documento.
Por padrão, a ordem das colunas no esquema corresponde à ordem na tabela extraída. No entanto, se uma coluna for omitida durante a detecção automática e for adicionada manualmente posteriormente, ela aparecerá no final da tabela.
Para reordenar os nomes das colunas nas tabelas:
Passe o mouse sobre o nome da coluna no painel lateral e arraste-a clicando no ícone de
arrastar.Clique em Exibir ao lado do nome da tabela. A nova ordem das colunas na tabela é exibida na pré-visualização.
Mapeamento de dados para entradas
Por padrão, o mapeamento automático está ativado. No entanto, você pode mapear valores para as entradas.
Para mapear valores para entradas, conclua as etapas a seguir:
Selecione o nó do extrator de documentos e clique em Editar mapeamento de dados.
Especifique os valores de entrada para o mapeamento de dados. Para obter mais informações sobre o mapeamento de dados, consulte Mapeamento de dados.
Tabelas de mapeamento extraídas de um nó extrator de documentos para outros nós em um fluxo de trabalho
Agora você pode mapear uma saída do tipo tabela a partir de um nó extrator de documentos em um fluxo de trabalho. Você pode fazer qualquer uma das seguintes opções:
Para exibir a tabela inteira em um chat, mapeie a tabela extraída no fluxo de trabalho usando o tipo de interação de lista em um nó extrator de documentos.

Para exibir os dados das linhas de uma tabela em um chat, você pode iterar pelas linhas de uma tabela extraída usando um loop For each no fluxo de trabalho. Para fazer isso, você pode combinar um loop For each com um nó de atividade do usuário e uma saída de mensagem. Em seguida, para exibir cada linha, você pode selecionar as colunas no mapeamento de dados do loop Para cada.

Além disso, para usar qualquer saída de tabela extraída em um nó posterior no fluxo de trabalho, você pode usar esse mesmo processo de mapeamento de dados do loop For each. Isso permite um processamento adicional, como a aplicação de lógica condicional em um fluxo de trabalho.
Configurando uma avaliação do usuário
Você pode configurar as definições que acionam uma revisão do usuário.
Se a pontuação de confiança da extração do sistema for inferior ao limite de confiança de extração definido (para a opção não estruturada ) ou quando a extração retornar valores vazios (para a opção estruturada ), uma tarefa de revisão do usuário é criada e atribuída ao usuário.
Para configurar uma avaliação do usuário:
Selecione o extrator de documentos no fluxo de trabalho autêntico.
Ative a opção Revisão do usuário.
Faça o seguinte:
Para a opção não estruturada : clique no ícone Editar
no campo “Se a confiança da extração estiver abaixo de ”. Defina o limite de confiança de extração para todos os campos ou campos específicos que podem acionar uma revisão do usuário. Para selecionar campos específicos que acionam uma revisão do usuário, clique no ícone Editar
, selecione os campos específicos e clique em Concluído. A pontuação de confiança da extração reflete a proximidade com que os resultados extraídos correspondem aos valores esperados.Para a opção estruturada : clique no ícone Editar
no campo “Se a extração retornar valores vazios ”.Na lista Atribuir a, selecione uma destas opções:
Opção |
Descrição |
|---|---|
Iniciador de fluxo |
Apenas o usuário que inicia o fluxo pode revisar o documento. |
Usuário especificado |
Apenas um usuário específico pode revisar o document.If. Como nenhum usuário está atribuído, clique em “Atribuir usuário” para selecionar um usuário. O usuário selecionado é exibido no campo “Usuário atribuído ”. Para alterar o usuário, clique no ícone Editar |
Usuário a partir de uma variável |
Somente um usuário especificado em uma variável pode revisar o documento. |
O sistema notifica o usuário no chat que é necessária uma revisão, dependendo da pontuação de confiança da extração ou de valores vazios.

O usuário pode clicar na notificação do chat para visualizar a atividade de revisão.

O usuário pode então examinar os valores extraídos, fazer as alterações necessárias e enviar a revisão. Após o envio, o fluxo de trabalho continua com os valores atualizados.

Limites e restrições do extrator de documentos
Os extratores de documentos têm os seguintes limites e restrições.
Área |
Descrição |
|---|---|
Tamanho máximo do arquivo |
10 MB |
Número máximo de arquivos carregados |
5 arquivos |
Tipos de arquivos aceitos |
.doc,.docx,.jpe,.jpeg,.jpg,.pdf,.png,.ppt,.pptx,.tif,.tiff |
número máximo de páginas |
600 páginas |
Número máximo de campos |
25 campos |
As seguintes limitações também se aplicam ao extrator de documentos:
Valores de confiança para campos extraídos
O extrator de documentos estruturados não fornece pontuações de confiança para os valores dos campos extraídos, ao contrário do extrator de documentos não estruturados. Portanto, as regras de avaliação do usuário baseadas na confiança não podem ser configuradas.
Extração de menção única
O extrator de documentos captura apenas uma instância de um valor de campo em um documento, geralmente a primeira ocorrência. Por exemplo, se um número de fatura aparecer várias vezes, apenas uma instância será extraída. Para capturar vários valores, defina campos com rótulos semânticos distintos, como número de telefone residencial e número de telefone celular.
Criação de fluxos de trabalho autônomos
Um fluxo de trabalho agêntico define um conjunto de atividades e controles vinculados que são projetados para atingir um objetivo ou meta comercial específico. Saiba mais sobre fluxos de trabalho agênticos.