El arte de la automatización: Capítulo 3 – Procesamiento inteligente de documentos

Ilustración de engranajes

Las organizaciones dedican cada vez más tiempo a procesar documentos manualmente, y no podemos culpar a la mala calidad de imagen del fax.

Capítulo 3

Tratado en este capítulo

  • El auge de la IA en el procesamiento de documentos
  • El procesamiento inteligente de documentos está diseñado para extraer datos empresariales críticos, permitiendo una toma de decisiones mejor y más rápida e impulsando el rendimiento empresarial
  • Tres ejemplos de procesamiento inteligente de documentos
  • IBM y el procesamiento inteligente de documentos

El arte de la automatización: índice

El procesamiento de documentos está listo para el cambio

La explosión de contenido digital ha dado lugar a muchas variantes de formato y diseño de documentos, así como a nuevos canales de entrada con diferente calidad o capacidad de comprensión. Podríamos estar en el asiento trasero de un viaje compartido, tratando de hacer una foto de una factura de servicios públicos para solicitar un permiso de aparcamiento urgente. O podríamos estar intercambiando correos electrónicos con un paciente, tratando de procesar una reclamación sanitaria mientras teletrabajamos en remoto desde casa. En 2018, Forbes afirmó que en los dos años anteriores se había generado el 90% de los datos mundiales. Solo podemos imaginar cuánto se aceleró eso en 2020 entre el teletrabajo, la telemedicina, las colaboraciones sociales digitales y más.

Además de la explosión de contenido digital y canales de entrada, la tecnología y las técnicas de captura existentes ya no pueden escalar. Por ejemplo, la funcionalidad de huella dactilar se ha utilizado para especificar zonas de reconocimiento e información posicional con el fin de extraer los datos precisos necesarios en formatos de documentos específicos o coincidencias de tipos similares. Sin embargo, con tantos formatos de documentos únicos que surgen de nuevos programas sociales o económicos o de nuevas relaciones B2B, configurarlos quita tiempo para cerrar negocios, mejorar la economía o progresar en el bienestar social de los ciudadanos. Además, las hojas separadoras, como encabezados o códigos de barras para identificar los componentes de una aplicación, no son eficaces cuando se reciben entradas de diferentes canales, como el móvil, el correo electrónico y los formularios en línea.

El resultado es que las organizaciones dedican cada vez más tiempo a procesar documentos manualmente, y no podemos culpar a la mala calidad de imagen del fax. Una encuesta de 2019 realizada por Levvel Research reveló que el 57% de los datos de las facturas se introducen manualmente y el 49% de las aprobaciones de facturas requerían de dos a tres aprobadores.

Adoptar la IA para el procesamiento de documentos

Aunque la inteligencia artificial (IA) no es nueva, ha sido difícil para las organizaciones utilizarla con éxito para procesar documentos semiestructurados y no estructurados. El uso de la IA ha requerido importantes habilidades en ciencia de datos y miles de documentos de muestra para entrenar modelos. Esto, a su vez, ha dado lugar a largos ciclos de recopilación de documentos y datos para obtener beneficios empresariales.

Sin embargo, los avances en IA y herramientas sencillas han podido acelerar el uso del procesamiento de documentos. En primer lugar, han surgido algoritmos de deep learning que empiezan a imitar el pensamiento del cerebro humano. Estos algoritmos pueden identificar patrones contextuales válidos para comprender información no estructurada (como el contenido de un documento) y aplicar ese aprendizaje a cosas que no ha visto antes — lo que se denomina aprendizaje por transferencia. Esto ayuda a reducir el proceso de recopilación de documentos y los largos ciclos de entrenamiento. En segundo lugar, las herramientas no-code, con sencillas guías paso a paso, facilitan a los usuarios empresariales entrenar modelos de IA, dar formato o convertir la salida de datos y personalizar la tolerancia al riesgo empresarial.

Tres actividades principales del procesamiento inteligente de documentos

Aunque la implementación del procesamiento inteligente de documentos y el uso de modelos de IA pueden variar según el proveedor, las actividades principales siguen siendo las mismas:

  1. Clasificación de documentos
  2. Extracción de datos
  3. Output de datos

En primer lugar, la clasificación de documentos es la tarea mediante la cual se identifican los tipos de documentos, como facturas o formularios fiscales. Utilizando una serie de documentos de ejemplo, se puede entrenar un modelo de clasificación de IA en los diferentes tipos de documentos y en los campos y valores que corresponden a esos tipos de documentos. Esta actividad no solo alimenta la siguiente actividad de extracción de datos, sino que también permite transferir el aprendizaje a otros tipos de documentos similares y facilita una mejor búsqueda de documentos dentro de los repositorios de contenido.

A continuación, la extracción inteligente de datos es la actividad principal mediante la cual se extrae información importante y relevante de la página. Lo que consiste en identificar pares clave y de valor como un número de cuenta o un importe adeudado, definir el aspecto que deben tener los datos y dónde podrían estar en la página y entrenar los modelos de IA en la información relevante en cada uno de los diferentes tipos de documentos. En este paso, también se pueden extraer metadatos y asociarlos al documento para facilitar su búsqueda posterior.

Por último, la salida de datos consiste tanto en enriquecer los datos extraídos como en crear el archivo de salida final para su uso posterior. Los modelos basados en IA se pueden utilizar para autocorregir errores ortográficos comunes, convertir datos a formatos de salida estándar (p. ej. un número de teléfono) y dar formato a los datos para que parezcan coherentes (p. ej. dos decimales para valores en dólares). El último paso es crear el archivo de salida — normalmente un archivo JSON — que luego puede alimentar un flujo de trabajo o enviarlo a un repositorio de contenido para su uso posterior.

Salida de datos del procesamiento inteligente de documentos para impulsar la automatización de procesos

Uno de los principales beneficiarios del procesamiento inteligente de documentos es la automatización de procesos, mediante la cual los datos estructurados ya validados pueden incorporarse a las transacciones, permitiendo un procesamiento más rápido y operaciones escalables. Por ejemplo, la configuración manual de un flujo de trabajo, la introducción de datos y la validación de datos antes podrían haber llevado horas a un trabajador humano. Una integración entre el procesamiento inteligente de documentos y el flujo de trabajo puede eliminar estos pasos manuales, y los datos de salida pueden insertarse automáticamente en un proceso. Del mismo modo, los datos incorrectos introducidos en un bot de automatización de procesos robóticos pueden dar lugar a un siguiente paso defectuoso, lo que puede provocar un cuello de botella o un error en un proceso. Al aprovechar el output continuo del procesamiento inteligente de documentos, un bot RPA puede escalarlos a toda una organización completa con mayor facilidad. Por último, los paneles de control pueden permitir a los usuarios empresariales descubrir patrones y conocimiento relacionado con los datos extraídos o los cuellos de botella en los procesos, lo que puede llevar a tomas decisiones más informadas.

Para obtener más información sobre el papel de la RPA en la automatización, consulte "El arte de la automatización: Capítulo 2 — Automatización de procesos robóticos (RPA)".

Ejemplos de procesamiento inteligente de documentos

Hay pruebas sólidas de que existe demanda de automatización del procesamiento de documentos, por lo que la combinación de inteligencia artificial (IA) junto con herramientas low-code dará como resultado que las organizaciones mejoren la productividad de los trabajadores e impulsen el rendimiento empresarial. 

De hecho, al trabajar con nuestros propios clientes de IBM, hemos descubierto una serie de casos de uso en los que se puede aplicar el procesamiento inteligente de documentos. A continuación, veremos tres ejemplos de casos de uso y los beneficios potenciales que una organización puede obtener.

  • Seguros: apertura y gestión de cuentas, reclamaciones personales y comerciales
  • Gobierno: inscripción y elegibilidad en servicios sociales, planes de pensiones y jubilación, licencias y permisos
  • Banca: apertura y gestión de cuentas, aplicación de hipoteca/préstamo

Solicitud de proceso de presupuesto y aprobación de seguros comerciales

El proceso de presupuesto y aprobación de seguros comerciales es muy competitivo y a menudo la primera compañía en responder con un presupuesto gana el negocio. El desafío es que en muchas compañías de seguros, este proceso requiere una revisión manual, la introducción de datos de la solicitud y la lectura de la documentación de respaldo, lo que dificulta la competencia o el escalado. Esto también desvía la atención de los agentes de los servicios de asesoramiento, que son necesarios para retener y hacer crecer el negocio existente. El procesamiento inteligente de documentos puede automatizar este proceso utilizando IA con deep learning para leer y clasificar cada tipo de documento y extraer los datos adecuados de estos diferentes formatos. Los datos extraídos se pueden conectar a un flujo de trabajo para acelerar el proceso para elaborar el presupuesto y aprobar la solicitud.

Tres beneficios potenciales de aplicar el procesamiento inteligente de documentos son:

  1. Aumento de los ingresos gracias al cierre de más negocios sin necesidad
    de añadir personal.
  2. Mejora de la experiencia del cliente con un aumento de la velocidad de procesamiento.
  3. Retención y crecimiento de las cuentas de clientes existentes.

Solicitud de procesamiento de inscripción en servicios sociales

La inscripción en docenas de programas de gobierno locales — como asistencia alimentaria o vivienda subvencionada — requiere un ineficiente procesamiento manual en hojas de cálculo, ya que los equipos de TI no tienen los recursos para crear las soluciones necesarias. Mediante el uso de herramientas low-code y el procesamiento inteligente de documentos, los usuarios empresariales pueden crear aplicaciones de procesamiento sencillas pero adaptadas a sus necesidades y entrenar el sistema para que reconozca los campos clave de los formularios de inscripción. Además, los validadores fáciles de configurar pueden garantizar que los campos de fecha y moneda se reconozcan con precisión, y también se pueden crear validadores sencillos y personalizados para gestionar campos únicos como un número de la seguridad social.

Tres beneficios potenciales de aplicar el procesamiento inteligente de documentos son:

  1. Aumento de las inscripciones en el programa debido a tiempos de respuesta más rápidos.
  2. Implementación rentable de soluciones de automatización personalizadas con una visualización adecuada basada en roles de la información de identificación personal.
  3. Creado por usuarios empresariales con poca o ninguna participación de TI.

Gestión de cuentas para banca personal

Los bancos pueden tener más de 20 formularios diferentes de gestión de cuentas disponibles para descargar en su página web. Los titulares de las cuentas utilizan estos formularios para realizar cambios en las cuentas o cerrarlas. Hoy en día, esto puede requerir un equipo considerable de agentes para leer estos formularios, verificar los datos y luego ingresar los datos en un sistema de gestión de cuentas. Sin embargo, con herramientas low-code y procesamiento inteligente de documentos, el banco puede crear rápidamente soluciones para procesar cada formulario de gestión de cuentas y utilizar el procesamiento inteligente de documentos para entrenar el sistema en cada formulario con el fin no solo de reconocer campos comunes como la dirección del cliente y el número de cuenta, sino también campos únicos para cada formulario.

Al combinarse con RPA, el banco también puede tomar los datos extraídos y automatizar los cambios en los sistemas de respaldo del banco. Además, al aprovechar la clasificación inteligente de documentos, los formularios de cierre de cuentas se pueden marcar rápidamente y alertar a los agentes de los clientes que pueden presentar riesgos potenciales de fuga.

Tres beneficios potenciales de aplicar el procesamiento inteligente de documentos son:

  1. Mejora de la experiencia del cliente con tiempos de respuesta más rápidos.
  2. Mejor fidelización de clientes con identificación inteligente de riesgos de fuga.
  3. Reducción de los costes de banca minorista por cuenta.

IBM y el procesamiento inteligente de documentos

El enfoque de IBM sobre el procesamiento inteligente de documentos se presenta en nuestro IBM® Cloud Pak for Business Automation. Una solución nativa de la nube, Automation Document Processing es un conjunto de servicios con IA que lee y corrige automáticamente los datos de los documentos. Un diseñador de procesamiento de documentos proporciona una interfaz no-code fácil de usar para entrenar modelos en clasificación de documentos, extracción de datos y enriquecimientos de datos.

Automation document processing. Figura 1: automation document processing.

Además, IBM proporciona plantillas de aplicación para procesamiento de documentos que pueden utilizarse para procesar documentos de una sola página o lotes de documentos. Los kits de herramientas del diseñador de aplicaciones también se pueden utilizar para personalizar la aplicación del usuario final para que se vea y se sienta como otras aplicaciones de una organización. Por último, IBM proporciona herramientas de implementación sencillas e integración lista para usar con sus capacidades de servicios de contenido, IBM FileNet Content Manager, tanto para almacenar el documento como para la salida de datos.

El futuro del procesamiento inteligente de documentos

Aunque este capítulo ofrece una visión general de cómo el procesamiento de documentos se ha madurado para el cambio y dónde está desempeñando la IA un papel importante en el avance del procesamiento de documentos, hay más innovación por venir en este ámbito. Hay dos áreas clave, en particular, a las que hay que prestar atención. En primer lugar, a medida que los formatos y estructuras de los documentos semiestructurados y no estructurados continúan explotando, los modelos de IA deberán mantenerse al día. Desde la lectura de estructuras de tablas altamente complejas hasta el procesamiento de identificaciones emitidas por el gobierno con hologramas o marcas de agua, los modelos de IA tendrán el desafío de seguir siendo precisos.

En segundo lugar, si bien este espacio se ha denominado procesamiento inteligente de  documentos , los tipos de archivos de vídeo y audio van aumento. Es solo cuestión de tiempo antes de que estos tipos de archivos entren en la ruta crítica para el procesamiento de reclamaciones de seguros o la presentación de informes de incidentes policiales.

Quédese para el viaje, seguro que será emocionante.

Más información

Ilustración de El arte de la automatización
Soluciones relacionadas
Soluciones de automatización empresarial

Replantee su negocio con la IA y la automatización de IBM, que ayudan a que los sistemas de TI sean más proactivos, los procesos más eficientes y las personas más productivas.

Explore las soluciones de automatización
Servicios de consultoría en automatización

IBM garantiza la transformación empresarial para los clientes empresariales con sus servicios de consultoría de automatización extrema.

Servicios de automatización empresarial
IBM Cloud Pak For Business Automation

IBM Cloud Pak for Business Automation es un conjunto modular de componentes de software integrados para la gestión y automatización de operaciones.

Automatización de procesos empresariales
De el siguiente paso

Descubra soluciones de automatización de procesos empresariales que ofrecen automatizaciones inteligentes rápidamente con herramientas low-code.

Explore las soluciones de automatización Lea el caso de éxito de IBM Automation