Añadir extractores de documentos
Puede añadir extractores de documentos personalizados a los flujos de trabajo agentic para extraer campos o entidades como fecha, nombres y otros de los documentos.
Al configurar un extractor de documentos, puede elegir un modelo de la lista de modelos disponibles. También puede añadir su propio modelo personalizado a través de AI Gateway. Para obtener más información, consulte Adición de modelos de IA a través de AI Gateway.
Para añadir un extractor de documentos a un flujo de trabajo agéntico:
Abre el flujo de trabajo «agentico» en el generador de flujos de trabajo.
Haz clic en el icono «Añadir elementos
de flujo».Seleccione la pestaña Nodos de flujo.
Arrastre el extractor de documentos al flujo de trabajo agentic.
Seleccione una de estas opciones de herramienta para extraer campos de sus documentos: Estructurado o No estructurado. Para obtener más información y directrices sobre qué opción de herramienta es adecuada para su caso de uso de extracción de datos, consulte Elegir una opción de herramienta para extraer campos de documentos.
Como alternativa, para añadir un extractor de documentos, haga clic en la línea de conexión entre los nodos inicial y final y, a continuación, seleccione Añadir una actividad de flujo > Extractor de documentos.
Selección de una opción de herramienta para extraer campos de documentos
Puede elegir entre dos opciones de herramientas para extraer campos de los documentos: Estructurados y No estructurados. Estas herramientas difieren en la forma en que procesan la información, pero los pasos que hay que seguir en ambas opciones son prácticamente los mismos.
No estructurado : utiliza un modelo de lenguaje basado en texto para extraer campos de nivel superior de los documentos. Funciona mejor con contenido con mucho texto, pero no extrae valores de columnas de tablas.
Estructurado : utiliza un modelo de lenguaje multimodal basado en la visión para extraer tanto los campos de nivel superior como los datos de las tablas. Debido a que se basa en un modelo más grande, suele funcionar más lentamente.
Cuándo utilizar cada opción de la herramienta
Utilice «No estructurado» para documentos con mucho texto que abarcan varias páginas, como contratos, correos electrónicos o manuales, en los que los campos aparecen en los encabezados o en el cuerpo del texto. Para obtener más información, consulte Configuración de un extractor de documentos después de seleccionar la opción No estructurado.
Utilice Structured para documentos estructurados o con diseño fijo, normalmente de una a tres páginas, como facturas, órdenes de compra o formularios fiscales. Es ideal cuando necesitas extraer información de tablas. Para obtener más información, consulte Configuración de un extractor de documentos después de seleccionar la opción Estructurado.
Configuración de un extractor de documentos tras seleccionar la opción No estructurado
El modelo « watsonx/ibm/granite-3-3-8b-instruct » quedará obsoleto a partir del 24 de noviembre de 2025 y se retirará el 22 de febrero de 2026. Utilice el modelo predeterminado u otro modelo compatible para el extractor de documentos no estructurados.
Para configurar el extractor de documentos para identificar y extraer un conjunto de campos de documentos no estructurados:
Seleccione el extractor de documentos que ha añadido al flujo de trabajo agentic.
Haz clic en el icono «Editar
campos».- Seleccione en la lista Modelo el modelo que desea utilizar para el extractor de documentos.
Aparecerá un cuadro de diálogo para cargar los documentos y añadir campos.
En la lista de modelos, haz clic en «Ver todos los modelos de base» para abrir el cuadro de diálogo de selección de modelos, en el que se muestran todos los modelos disponibles. Para seleccionar un modelo, búscalo o elige uno de la lista. Una vez que hayas seleccionado un modelo, haz clic en Guardar. Se muestran todos los avisos relacionados con el modelo seleccionado, como avisos de obsolescencia o requisitos de licencia de terceros.
Algunos modelos incluyen una etiqueta de estado en el cuadro de diálogo para indicar estados como «Recomendado » o «De terceros ». Un icono de advertencia indica que un modelo podría retirarse o quedar obsoleto en una versión posterior.
Nota:Puedes subir documentos o añadir campos en cualquier orden. La extracción comienza cuando el sistema tiene al menos un documento y un campo.
Realice las tareas siguientes:
Sube tus documentos
Los documentos de muestra cargados ayudan a crear los campos. Estos documentos no entrenan al modelo, y tampoco forman parte del agente que se está configurando.
Puede llevar algún tiempo cargar los documentos.
Una vez finalizada la carga, podrá ver una vista previa del documento en la que podrá realizar las siguientes acciones utilizando las opciones de la barra de herramientas:
Seleccione en la lista un documento cargado para visualizarlo
Navegar por las páginas de un documento que esté visualizando
Ajustar la anchura y la altura de la página a la vista
Acercar y alejar una página para verla
Buscar un campo en un documento

En el ejemplo anterior, un usuario carga documentos de muestra y se muestra la vista previa de estos documentos.
- Añadir campos
Haz clic en «Añadir campo» para añadir los campos correspondientes a la información que deseas extraer de los documentos, como fechas, nombres y otros datos.
El extractor de documentos busca valores relacionados con los campos en todos los documentos.

En el ejemplo anterior, un usuario ha añadido los campos «precio», «duración» y «fecha», que se buscan y se muestran en el panel de vista previa del documento.
Para editar los detalles del campo, pasa el cursor por encima del campo y haz clic en el icono «Ver
detalles del campo». Puedes editar el nombre del campo, la descripción y el tipo de datos. Puede añadir ejemplos del campo para ayudar al modelo a comprender qué información desea extraer y hacer clic en Mostrar en documento para obtener los resultados. También puede eliminar el campo si ya no es necesario.
Para cargar más documentos y eliminar documentos existentes, seleccione la opción Gestionar documentos de la lista de la barra de herramientas de vista previa de documentos.
Navegue por los distintos documentos desde la barra de herramientas de vista previa de documentos para comprobar si la información se extrae como esperaba.
Configure los ajustes que activan una revisión por parte del usuario. Para obtener más información, consulte Configuración de una revisión de usuario.
Después de verificar y obtener los resultados esperados, cierre el cuadro de diálogo del extractor de documentos.
Configuración de un extractor de documentos tras seleccionar la opción Estructurado
La capacidad de extraer todos los elementos de línea de documentos estructurados, como órdenes de compra y facturas, reduce el esfuerzo manual y mejora la precisión en el procesamiento de documentos.
Para configurar el extractor de documentos para identificar y extraer un conjunto de campos de documentos estructurados:
Seleccione el extractor de documentos que ha añadido al flujo de trabajo agentic.
Haz clic en el icono «Editar
Aparecerá un cuadro de diálogo para cargar los documentos y añadir campos.
campos».- Seleccione o especifique un modelo que desee utilizar para el extractor de documentos en la lista «Modelos ».
En la lista de modelos, haz clic en «Ver todos los modelos de base» para abrir el cuadro de diálogo de selección de modelos, en el que se muestran todos los modelos disponibles. Para seleccionar un modelo, búscalo o elige uno de la lista. Una vez que hayas seleccionado un modelo, haz clic en Guardar. Se muestran todos los avisos relacionados con el modelo seleccionado, como avisos de obsolescencia o requisitos de licencia de terceros.
Algunos modelos incluyen una etiqueta de estado en el cuadro de diálogo para indicar estados como «Recomendado » o «De terceros ». Un icono de advertencia indica que un modelo podría retirarse o quedar obsoleto en una versión posterior.
Nota:Puedes subir documentos o añadir campos en cualquier orden. La extracción comienza cuando el sistema tiene al menos un documento y un campo.
- Realice las tareas siguientes:
- Utiliza un esquema de una lista de esquemas predefinidos
Puedes seleccionar un tipo de documento y añadir varios campos asociados a ese tipo de documento, en lugar de añadir los campos manualmente uno por uno. Hay varios tipos de documentos, como extractos bancarios, facturas, reclamaciones de seguros y otros, entre los que se pueden seleccionar los esquemas.
Para añadir campos de un esquema predefinido, haz lo siguiente:- Haz clic en «Definir esquema ».
- Seleccione un tipo de documento en «Esquemas predefinidos ».
Se muestra una descripción del tipo de documento seleccionado y de todos los campos asociados que están disponibles para extraer datos.
- Pulse Crear.
El extractor de documentos busca valores relacionados con los campos en todos los documentos.

En el ejemplo anterior, en el cuadro de diálogo se muestran los campos que se extraen de una factura.
Para editar los detalles del campo, pasa el cursor por encima del campo y haz clic en el icono «Ver
detalles del campo». Puede editar el nombre del campo, el tipo de datos y la descripción. Puede añadir ejemplos del campo para ayudar al modelo a comprender qué información desea extraer y hacer clic en Mostrar en documento para obtener los resultados. También puedes eliminar el campo si no lo necesitas.Sube tus documentos
Los documentos de muestra cargados ayudan a crear los campos. Estos documentos no entrenan al modelo, y tampoco forman parte del agente que se está configurando.
Puede llevar algún tiempo cargar los documentos.
Una vez finalizada la carga, podrá ver una vista previa del documento en la que podrá realizar las siguientes acciones utilizando las opciones de la barra de herramientas:
Seleccione en la lista un documento cargado para visualizarlo
Navegar por las páginas de un documento que esté visualizando
Ajustar la anchura y la altura de la página a la vista
Acercar y alejar una página para verla
Buscar un campo en un documento

En el ejemplo anterior, un usuario sube un documento de factura de muestra y se muestra la vista previa del documento. La vista previa también muestra las tablas detectadas automáticamente en el documento, de las que se pueden extraer datos.
Añadir tablas detectadas automáticamente
Para añadir una tabla detectada automáticamente en el documento con el fin de extraer datos, haz clic en el icono «Añadir
tabla».Los datos de la tabla se añaden a los campos para su extracción bajo un nombre de tabla. Para editar el nombre de la tabla, pasa el cursor por encima del nombre de la tabla y haz clic en el icono Editar
. Para eliminar la tabla, puedes hacer clic en el icono
Eliminar.También puede reordenar las columnas de las tablas extraídas. Para obtener más información, consulte Reordenar columnas.
Añadir tablas personalizadas
Para añadir una tabla personalizada y definir los campos de los que se van a extraer los datos, haz clic en «Definir esquema », selecciona «Esquema definido por el usuario » y haz clic en «Crear ».
Para añadir una tabla personalizada, haz lo siguiente:
a. Haz clic en el
icono «Añadir tabla» del panel lateral, introduce un nombre para tu tabla personalizada y pulsa Intro.b. Haga clic en Añadir columna, introduzca el nombre de la columna para su tabla personalizada y pulse Intro. Repita este paso para añadir más columnas a su tabla personalizada.
El sistema busca los valores de columna en el documento. El primer valor que se encuentra para una columna se muestra en el panel lateral y todos los demás valores de esa columna se resaltan en la vista previa del documento.
Si no se encuentra un valor para una columna, no se muestra ningún valor en el panel lateral de la columna. En este caso, puede hacer clic en el icono «Ver detalles de
la columna» para que el sistema le sugiera el valor esperado en el documento. Esta acción ayuda al sistema a comprender qué información desea extraer para la columna.Para solicitar un valor, seleccione el tipo de datos, active el interruptor Descripción e introduzca o describa el valor, y luego haga clic en Mostrar en el documento. El sistema busca los valores en el documento basándose en su descripción. Si se encuentra un valor, se muestra en el panel lateral. También puede eliminar la columna si ya no la necesita.
También puede reordenar las columnas de las tablas extraídas. Para obtener más información, consulte Reordenar columnas.
c. Para ver su tabla personalizada con una vista previa de los datos extraídos, haga clic en Ver junto al nombre de la tabla.

Añadir campos
Para añadir más campos con la información que desees extraer de los documentos, como fechas, nombres y otros datos, haz clic en «Definir esquema », selecciona «Esquema definido por el usuario » y haz clic en «Crear» -> «Añadir campo ».
Una vez introducido el nombre de un campo, el extractor de documentos busca los valores relacionados con ese campo en todos los documentos.
Para editar los detalles del campo, pasa el cursor por encima del campo y haz clic en el icono «Ver
detalles del campo». Puede editar el nombre del campo, el tipo de datos y la descripción. Puede añadir ejemplos del campo para ayudar al modelo a comprender qué información desea extraer y hacer clic en Mostrar en documento para obtener los resultados. También puede eliminar el campo si ya no es necesario. Para subir más documentos y eliminar los ya existentes, haz clic en el icono «Gestionar
documentos» de la lista que aparece en la barra de herramientas de vista previa de documentos.Navegue por los distintos documentos desde la barra de herramientas de vista previa de documentos para comprobar si la información se extrae como esperaba.
Configure los ajustes que activan una revisión por parte del usuario. Para obtener más información, consulte Configuración de una revisión de usuario.
Después de verificar y obtener los resultados esperados, cierre el cuadro de diálogo del extractor de documentos.
Cambio del orden de las columnas
Puede reordenar las columnas de las tablas arrastrándolas y soltándolas. Esta acción resulta útil, por ejemplo, cuando se desea garantizar que el orden de las columnas coincida con el de la tabla original del documento.
De forma predeterminada, el orden de las columnas en el esquema coincide con el orden de la tabla extraída. Sin embargo, si se omite una columna durante la detección automática y se añade manualmente más tarde, aparecerá al final de la tabla.
Para reordenar los nombres de las columnas en las tablas:
Pasa el cursor por encima del nombre de la columna en el panel lateral y arrástrala haciendo clic en el icono de
arrastre.Haga clic en Ver junto al nombre de la tabla. El nuevo orden de las columnas de la tabla se muestra en la vista previa.
Asignación de datos a entradas
Por defecto, la asignación automática está activada. Sin embargo, puede asignar valores a las entradas.
Para asignar valores a entradas, siga estos pasos:
Seleccione el nodo del extractor de documentos y haga clic en Editar asignación de datos.
Especifique los valores de entrada para la asignación de datos. Para obtener más información sobre la asignación de datos, consulte Asignación de datos.
Asignación de tablas extraídas de un nodo extractor de documentos a otros nodos en un flujo de trabajo
Ahora puede asignar una salida de tipo tabla desde un nodo extractor de documentos en un flujo de trabajo. Puede hacer cualquiera de las siguientes cosas:
Para mostrar la tabla completa en un chat, asigne la tabla extraída en el flujo de trabajo utilizando el tipo de interacción de lista en un nodo extractor de documentos.

Para mostrar los datos de las filas de una tabla en un chat, puede iterar a través de las filas de una tabla extraída utilizando un bucle «For each» en el flujo de trabajo. Para ello, puede combinar un bucle «For each» con un nodo de actividad de usuario y una salida de mensaje. A continuación, para mostrar cada fila, puede seleccionar las columnas en la asignación de datos del bucle «Para cada».

Además, para utilizar cualquier salida de tabla extraída en un nodo posterior del flujo de trabajo, puede utilizar este mismo proceso de asignación de datos del bucle «For each». Esto permite realizar procesamientos adicionales, como aplicar lógica condicional en un flujo de trabajo.
Configuración de una reseña de usuario
Vista previa
Puede configurar los ajustes que activan una revisión de usuario.
Si la puntuación de confianza de la extracción del sistema es inferior al umbral de confianza de extracción establecido (para la opción no estructurada ), o cuando la extracción devuelve valores vacíos (para la opción estructurada ), se crea una tarea de revisión del usuario y se le asigna al usuario.
Para configurar una reseña de usuario:
Seleccione el extractor de documentos en el flujo de trabajo agéntico.
Active el interruptor Revisión del usuario.
Lleve a cabo una de las acciones siguientes:
Para la opción no estructurada : haz clic en el icono Editar
en el campo «Si la confianza de la extracción es inferior a ». Establezca el umbral de confianza de extracción para todos los campos o campos específicos que pueden desencadenar una revisión por parte del usuario. Para seleccionar los campos concretos que activan una revisión por parte del usuario, haz clic en el icono Editar
, selecciona los campos correspondientes y haz clic en Hecho. La puntuación de confianza de la extracción refleja hasta qué punto los resultados extraídos coinciden con los valores esperados.Para la opción estructurada : haz clic en el icono Editar
en el campo «Si la extracción devuelve algún valor vacío ».En la lista Asignar a, seleccione una de estas opciones:
Opción |
Descripción |
|---|---|
Iniciador de flujo |
Solo el usuario que inicia el flujo puede revisar el documento. |
Usuario especificado |
Solo un usuario específico puede revisar el document.If. Si no hay ningún usuario asignado, haz clic en «Asignar usuario» para seleccionar uno. El usuario seleccionado aparece en el campo «Usuario asignado ». Para cambiar de usuario, haz clic en el icono Editar |
Usuario desde una variable |
Solo un usuario especificado en una variable puede revisar el documento. |
El sistema notifica al usuario en el chat que se requiere una revisión en función de la puntuación de confianza de la extracción o de los valores vacíos.

El usuario puede hacer clic en la notificación del chat para ver la actividad de revisión.

A continuación, el usuario puede examinar los valores extraídos, realizar los cambios necesarios y enviar la revisión. Tras el envío, el flujo de trabajo continúa con los valores actualizados.

Límites y restricciones del extractor de documentos
Los extractores de documentos tienen los siguientes límites y restricciones.
Área |
Descripción |
|---|---|
Tamaño máximo de archivo |
10 MB |
Número máximo de archivos cargados |
5 expedientes |
Tipos de archivo aceptados |
.doc,.docx,.jpe,.jpeg.jpg,.pdf,.png,.ppt,.pptx,.tif,.tiff |
número máximo de páginas |
600 páginas |
Número máximo de campos |
25 campos |
Las siguientes limitaciones también se aplican al extractor de documentos:
Valores de confianza para los campos extraídos
El extractor de documentos estructurados no proporciona puntuaciones de confianza para los valores de campo extraídos, a diferencia del extractor de documentos no estructurados. Por lo tanto, no se pueden configurar reglas de reseñas de usuarios basadas en la confianza.
Extracción de mención única
El extractor de documentos captura solo una instancia del valor de un campo en un documento, normalmente la primera vez que aparece. Por ejemplo, si un número de factura aparece varias veces, solo se extrae una instancia. Para capturar varios valores, defina campos con etiquetas semánticas distintas, como número de teléfono fijo y número de teléfono móvil.
Creación de flujos de trabajo con agentes
Un flujo de trabajo agéntico define un conjunto de actividades y controles vinculados que están diseñados para lograr un propósito u objetivo empresarial específico. Más información sobre los flujos de trabajo agénticos.