Añadir extractores de documentos

Puede añadir extractores de documentos personalizados a los flujos de trabajo agentic para extraer campos o entidades como fecha, nombres y otros de los documentos.

Al configurar un extractor de documentos, puede elegir un modelo de la lista de modelos disponibles. También puede añadir su propio modelo personalizado a través de AI Gateway. Para obtener más información, consulte Adición de modelos de IA a través de AI Gateway.

Para añadir un extractor de documentos a un flujo de trabajo agéntico:

  1. Abre el flujo de trabajo «agentico» en el generador de flujos de trabajo.

  2. Haz clic en el icono «Añadir elementos icono Añadir de flujo».

  3. Seleccione la pestaña Nodos de flujo.

  4. Arrastre el extractor de documentos al flujo de trabajo agentic.

  5. Seleccione una de estas opciones de herramienta para extraer campos de sus documentos: Estructurado o No estructurado. Para obtener más información y directrices sobre qué opción de herramienta es adecuada para su caso de uso de extracción de datos, consulte Elegir una opción de herramienta para extraer campos de documentos.

Como alternativa, para añadir un extractor de documentos, haga clic en la línea de conexión entre los nodos inicial y final y, a continuación, seleccione Añadir una actividad de flujo > Extractor de documentos.

Selección de una opción de herramienta para extraer campos de documentos

Puede elegir entre dos opciones de herramientas para extraer campos de los documentos: Estructurados y No estructurados. Estas herramientas difieren en la forma en que procesan la información, pero los pasos que hay que seguir en ambas opciones son prácticamente los mismos.

  • No estructurado : utiliza un modelo de lenguaje basado en texto para extraer campos de nivel superior de los documentos. Funciona mejor con contenido con mucho texto, pero no extrae valores de columnas de tablas.

  • Estructurado : utiliza un modelo de lenguaje multimodal basado en la visión para extraer tanto los campos de nivel superior como los datos de las tablas. Debido a que se basa en un modelo más grande, suele funcionar más lentamente.

Cuándo utilizar cada opción de la herramienta

Configuración de un extractor de documentos tras seleccionar la opción No estructurado

Nota:

El modelo « watsonx/ibm/granite-3-3-8b-instruct » quedará obsoleto a partir del 24 de noviembre de 2025 y se retirará el 22 de febrero de 2026. Utilice el modelo predeterminado u otro modelo compatible para el extractor de documentos no estructurados.

Para configurar el extractor de documentos para identificar y extraer un conjunto de campos de documentos no estructurados:

  1. Seleccione el extractor de documentos que ha añadido al flujo de trabajo agentic.

  2. Haz clic en el icono «Editar editar campos».

  3. Seleccione en la lista Modelo el modelo que desea utilizar para el extractor de documentos.

    Aparecerá un cuadro de diálogo para cargar los documentos y añadir campos.

    En la lista de modelos, haz clic en «Ver todos los modelos de base» para abrir el cuadro de diálogo de selección de modelos, en el que se muestran todos los modelos disponibles. Para seleccionar un modelo, búscalo o elige uno de la lista. Una vez que hayas seleccionado un modelo, haz clic en Guardar. Se muestran todos los avisos relacionados con el modelo seleccionado, como avisos de obsolescencia o requisitos de licencia de terceros.

    Algunos modelos incluyen una etiqueta de estado en el cuadro de diálogo para indicar estados como «Recomendado » o «De terceros ». Un icono de advertencia indica que un modelo podría retirarse o quedar obsoleto en una versión posterior.

    Nota:

    Puedes subir documentos o añadir campos en cualquier orden. La extracción comienza cuando el sistema tiene al menos un documento y un campo.

  4. Realice las tareas siguientes:

    • Sube tus documentos

      Los documentos de muestra cargados ayudan a crear los campos. Estos documentos no entrenan al modelo, y tampoco forman parte del agente que se está configurando.

      Puede llevar algún tiempo cargar los documentos.

      Una vez finalizada la carga, podrá ver una vista previa del documento en la que podrá realizar las siguientes acciones utilizando las opciones de la barra de herramientas:

      • Seleccione en la lista un documento cargado para visualizarlo

      • Navegar por las páginas de un documento que esté visualizando

      • Ajustar la anchura y la altura de la página a la vista

      • Acercar y alejar una página para verla

      • Buscar un campo en un documento

      Ejemplo de documentos cargados

      En el ejemplo anterior, un usuario carga documentos de muestra y se muestra la vista previa de estos documentos.

    • Añadir campos

      Haz clic en «Añadir campo» para añadir los campos correspondientes a la información que deseas extraer de los documentos, como fechas, nombres y otros datos.

      El extractor de documentos busca valores relacionados con los campos en todos los documentos.Figura 2: Ejemplo que muestra los campos que se deben extraer de un documento.

      En el ejemplo anterior, un usuario ha añadido los campos «precio», «duración» y «fecha», que se buscan y se muestran en el panel de vista previa del documento.

      Para editar los detalles del campo, pasa el cursor por encima del campo y haz clic en el icono «Ver editar detalles del campo». Puedes editar el nombre del campo, la descripción y el tipo de datos. Puede añadir ejemplos del campo para ayudar al modelo a comprender qué información desea extraer y hacer clic en Mostrar en documento para obtener los resultados. También puede eliminar el campo si ya no es necesario.

  5. Para cargar más documentos y eliminar documentos existentes, seleccione la opción Gestionar documentos de la lista de la barra de herramientas de vista previa de documentos.

  6. Navegue por los distintos documentos desde la barra de herramientas de vista previa de documentos para comprobar si la información se extrae como esperaba.

  7. Configure los ajustes que activan una revisión por parte del usuario. Para obtener más información, consulte Configuración de una revisión de usuario.

  8. Después de verificar y obtener los resultados esperados, cierre el cuadro de diálogo del extractor de documentos.

Configuración de un extractor de documentos tras seleccionar la opción Estructurado

La capacidad de extraer todos los elementos de línea de documentos estructurados, como órdenes de compra y facturas, reduce el esfuerzo manual y mejora la precisión en el procesamiento de documentos.

Para configurar el extractor de documentos para identificar y extraer un conjunto de campos de documentos estructurados:

  1. Seleccione el extractor de documentos que ha añadido al flujo de trabajo agentic.

  2. Haz clic en el icono «Editar editar campos».

    Aparecerá un cuadro de diálogo para cargar los documentos y añadir campos.
  3. Seleccione o especifique un modelo que desee utilizar para el extractor de documentos en la lista «Modelos ».

    En la lista de modelos, haz clic en «Ver todos los modelos de base» para abrir el cuadro de diálogo de selección de modelos, en el que se muestran todos los modelos disponibles. Para seleccionar un modelo, búscalo o elige uno de la lista. Una vez que hayas seleccionado un modelo, haz clic en Guardar. Se muestran todos los avisos relacionados con el modelo seleccionado, como avisos de obsolescencia o requisitos de licencia de terceros.

    Algunos modelos incluyen una etiqueta de estado en el cuadro de diálogo para indicar estados como «Recomendado » o «De terceros ». Un icono de advertencia indica que un modelo podría retirarse o quedar obsoleto en una versión posterior.

    Nota:

    Puedes subir documentos o añadir campos en cualquier orden. La extracción comienza cuando el sistema tiene al menos un documento y un campo.

  4. Realice las tareas siguientes:
    • Utiliza un esquema de una lista de esquemas predefinidos

    Puedes seleccionar un tipo de documento y añadir varios campos asociados a ese tipo de documento, en lugar de añadir los campos manualmente uno por uno. Hay varios tipos de documentos, como extractos bancarios, facturas, reclamaciones de seguros y otros, entre los que se pueden seleccionar los esquemas.

    Para añadir campos de un esquema predefinido, haz lo siguiente:
    1. Haz clic en «Definir esquema ».
    2. Seleccione un tipo de documento en «Esquemas predefinidos ».

      Se muestra una descripción del tipo de documento seleccionado y de todos los campos asociados que están disponibles para extraer datos.

    3. Pulse Crear.

      El extractor de documentos busca valores relacionados con los campos en todos los documentos.Figura 3: Ejemplo que muestra los campos de una factura.

    En el ejemplo anterior, en el cuadro de diálogo se muestran los campos que se extraen de una factura.

    Para editar los detalles del campo, pasa el cursor por encima del campo y haz clic en el icono «Ver editar detalles del campo». Puede editar el nombre del campo, el tipo de datos y la descripción. Puede añadir ejemplos del campo para ayudar al modelo a comprender qué información desea extraer y hacer clic en Mostrar en documento para obtener los resultados. También puedes eliminar el campo si no lo necesitas.

    • Sube tus documentos

    Los documentos de muestra cargados ayudan a crear los campos. Estos documentos no entrenan al modelo, y tampoco forman parte del agente que se está configurando.

    Puede llevar algún tiempo cargar los documentos.

    Una vez finalizada la carga, podrá ver una vista previa del documento en la que podrá realizar las siguientes acciones utilizando las opciones de la barra de herramientas:

    • Seleccione en la lista un documento cargado para visualizarlo

    • Navegar por las páginas de un documento que esté visualizando

    • Ajustar la anchura y la altura de la página a la vista

    • Acercar y alejar una página para verla

    • Buscar un campo en un documento

    Ejemplo que muestra una factura cargada

    En el ejemplo anterior, un usuario sube un documento de factura de muestra y se muestra la vista previa del documento. La vista previa también muestra las tablas detectadas automáticamente en el documento, de las que se pueden extraer datos.

    • Añadir tablas detectadas automáticamente

    Para añadir una tabla detectada automáticamente en el documento con el fin de extraer datos, haz clic en el icono «Añadir añadir_tabla tabla».

    Los datos de la tabla se añaden a los campos para su extracción bajo un nombre de tabla. Para editar el nombre de la tabla, pasa el cursor por encima del nombre de la tabla y haz clic en el icono Editar editar. Para eliminar la tabla, puedes hacer clic en el icono editarEliminar.

    También puede reordenar las columnas de las tablas extraídas. Para obtener más información, consulte Reordenar columnas.

    • Añadir tablas personalizadas

    Para añadir una tabla personalizada y definir los campos de los que se van a extraer los datos, haz clic en «Definir esquema », selecciona «Esquema definido por el usuario » y haz clic en «Crear ».

    Para añadir una tabla personalizada, haz lo siguiente:

    a. Haz clic en el añadir_tabla icono «Añadir tabla» del panel lateral, introduce un nombre para tu tabla personalizada y pulsa Intro.

    b. Haga clic en Añadir columna, introduzca el nombre de la columna para su tabla personalizada y pulse Intro. Repita este paso para añadir más columnas a su tabla personalizada.

    El sistema busca los valores de columna en el documento. El primer valor que se encuentra para una columna se muestra en el panel lateral y todos los demás valores de esa columna se resaltan en la vista previa del documento.

    Si no se encuentra un valor para una columna, no se muestra ningún valor en el panel lateral de la columna. En este caso, puede hacer clic en el icono «Ver detalles de Ver detalles de la columna la columna» para que el sistema le sugiera el valor esperado en el documento. Esta acción ayuda al sistema a comprender qué información desea extraer para la columna.

    Para solicitar un valor, seleccione el tipo de datos, active el interruptor Descripción e introduzca o describa el valor, y luego haga clic en Mostrar en el documento. El sistema busca los valores en el documento basándose en su descripción. Si se encuentra un valor, se muestra en el panel lateral. También puede eliminar la columna si ya no la necesita.

    También puede reordenar las columnas de las tablas extraídas. Para obtener más información, consulte Reordenar columnas.

    c. Para ver su tabla personalizada con una vista previa de los datos extraídos, haga clic en Ver junto al nombre de la tabla.

    Ejemplo que muestra una tabla personalizada con las columnas

    • Añadir campos

    Para añadir más campos con la información que desees extraer de los documentos, como fechas, nombres y otros datos, haz clic en «Definir esquema », selecciona «Esquema definido por el usuario » y haz clic en «Crear» -> «Añadir campo ».

    Una vez introducido el nombre de un campo, el extractor de documentos busca los valores relacionados con ese campo en todos los documentos.

    Para editar los detalles del campo, pasa el cursor por encima del campo y haz clic en el icono «Ver editardetalles del campo». Puede editar el nombre del campo, el tipo de datos y la descripción. Puede añadir ejemplos del campo para ayudar al modelo a comprender qué información desea extraer y hacer clic en Mostrar en documento para obtener los resultados. También puede eliminar el campo si ya no es necesario.

  5. Para subir más documentos y eliminar los ya existentes, haz clic en el icono «Gestionar gestionar-docdocumentos» de la lista que aparece en la barra de herramientas de vista previa de documentos.

  6. Navegue por los distintos documentos desde la barra de herramientas de vista previa de documentos para comprobar si la información se extrae como esperaba.

  7. Configure los ajustes que activan una revisión por parte del usuario. Para obtener más información, consulte Configuración de una revisión de usuario.

  8. Después de verificar y obtener los resultados esperados, cierre el cuadro de diálogo del extractor de documentos.

Cambio del orden de las columnas

Puede reordenar las columnas de las tablas arrastrándolas y soltándolas. Esta acción resulta útil, por ejemplo, cuando se desea garantizar que el orden de las columnas coincida con el de la tabla original del documento.

De forma predeterminada, el orden de las columnas en el esquema coincide con el orden de la tabla extraída. Sin embargo, si se omite una columna durante la detección automática y se añade manualmente más tarde, aparecerá al final de la tabla.

Para reordenar los nombres de las columnas en las tablas:

  1. Pasa el cursor por encima del nombre de la columna en el panel lateral y arrástrala haciendo clic en el icono de Arrastrararrastre.

  2. Haga clic en Ver junto al nombre de la tabla. El nuevo orden de las columnas de la tabla se muestra en la vista previa.

Asignación de datos a entradas

Por defecto, la asignación automática está activada. Sin embargo, puede asignar valores a las entradas.

Para asignar valores a entradas, siga estos pasos:

  1. Seleccione el nodo del extractor de documentos y haga clic en Editar asignación de datos.

  2. Especifique los valores de entrada para la asignación de datos. Para obtener más información sobre la asignación de datos, consulte Asignación de datos.

Asignación de tablas extraídas de un nodo extractor de documentos a otros nodos en un flujo de trabajo

Ahora puede asignar una salida de tipo tabla desde un nodo extractor de documentos en un flujo de trabajo. Puede hacer cualquiera de las siguientes cosas:

  • Para mostrar la tabla completa en un chat, asigne la tabla extraída en el flujo de trabajo utilizando el tipo de interacción de lista en un nodo extractor de documentos.

Ejemplo que muestra una asignación de tabla personalizada utilizando una lista en un extractor de documentos

  • Para mostrar los datos de las filas de una tabla en un chat, puede iterar a través de las filas de una tabla extraída utilizando un bucle «For each» en el flujo de trabajo. Para ello, puede combinar un bucle «For each» con un nodo de actividad de usuario y una salida de mensaje. A continuación, para mostrar cada fila, puede seleccionar las columnas en la asignación de datos del bucle «Para cada».

Ejemplo que muestra la asignación de datos de las columnas en un bucle «For each»

Además, para utilizar cualquier salida de tabla extraída en un nodo posterior del flujo de trabajo, puede utilizar este mismo proceso de asignación de datos del bucle «For each». Esto permite realizar procesamientos adicionales, como aplicar lógica condicional en un flujo de trabajo.

Configuración de una reseña de usuario

Vista previa

Puede configurar los ajustes que activan una revisión de usuario.

Si la puntuación de confianza de la extracción del sistema es inferior al umbral de confianza de extracción establecido (para la opción no estructurada ), o cuando la extracción devuelve valores vacíos (para la opción estructurada ), se crea una tarea de revisión del usuario y se le asigna al usuario.

Para configurar una reseña de usuario:

  1. Seleccione el extractor de documentos en el flujo de trabajo agéntico.

  2. Active el interruptor Revisión del usuario.

  3. Lleve a cabo una de las acciones siguientes:

    • Para la opción no estructurada : haz clic en el icono Editar icono de edición en el campo «Si la confianza de la extracción es inferior a ». Establezca el umbral de confianza de extracción para todos los campos o campos específicos que pueden desencadenar una revisión por parte del usuario. Para seleccionar los campos concretos que activan una revisión por parte del usuario, haz clic en el icono Editar icono de edición, selecciona los campos correspondientes y haz clic en Hecho. La puntuación de confianza de la extracción refleja hasta qué punto los resultados extraídos coinciden con los valores esperados.

    • Para la opción estructurada : haz clic en el icono Editar icono de edición en el campo «Si la extracción devuelve algún valor vacío ».

      1. En la lista Asignar a, seleccione una de estas opciones:

Opción

Descripción

Iniciador de flujo

Solo el usuario que inicia el flujo puede revisar el documento.

Usuario especificado

Solo un usuario específico puede revisar el document.If. Si no hay ningún usuario asignado, haz clic en «Asignar usuario» para seleccionar uno. El usuario seleccionado aparece en el campo «Usuario asignado ». Para cambiar de usuario, haz clic en el icono Editar icono de edición y selecciona otro usuario.

Usuario desde una variable

Solo un usuario especificado en una variable puede revisar el documento.

El sistema notifica al usuario en el chat que se requiere una revisión en función de la puntuación de confianza de la extracción o de los valores vacíos.

Ejemplo que muestra una notificación de tarea de revisión de usuario en el chat

El usuario puede hacer clic en la notificación del chat para ver la actividad de revisión.

Ejemplo que muestra una tarea de revisión de usuario en el chat

A continuación, el usuario puede examinar los valores extraídos, realizar los cambios necesarios y enviar la revisión. Tras el envío, el flujo de trabajo continúa con los valores actualizados.

Ejemplo que muestra la opinión de un usuario

Límites y restricciones del extractor de documentos

Los extractores de documentos tienen los siguientes límites y restricciones.

Área

Descripción

Tamaño máximo de archivo

10 MB

Número máximo de archivos cargados

5 expedientes

Tipos de archivo aceptados

.doc,.docx,.jpe,.jpeg.jpg,.pdf,.png,.ppt,.pptx,.tif,.tiff

número máximo de páginas

600 páginas

Número máximo de campos

25 campos

Las siguientes limitaciones también se aplican al extractor de documentos:

  • Valores de confianza para los campos extraídos

El extractor de documentos estructurados no proporciona puntuaciones de confianza para los valores de campo extraídos, a diferencia del extractor de documentos no estructurados. Por lo tanto, no se pueden configurar reglas de reseñas de usuarios basadas en la confianza.

  • Extracción de mención única

El extractor de documentos captura solo una instancia del valor de un campo en un documento, normalmente la primera vez que aparece. Por ejemplo, si un número de factura aparece varias veces, solo se extrae una instancia. Para capturar varios valores, defina campos con etiquetas semánticas distintas, como número de teléfono fijo y número de teléfono móvil.

Creación de flujos de trabajo con agentes

Un flujo de trabajo agéntico define un conjunto de actividades y controles vinculados que están diseñados para lograr un propósito u objetivo empresarial específico. Más información sobre los flujos de trabajo agénticos.