Digital Office Company (DOC), un proveedor de soluciones y servicios de gestión de la información con sede en Finlandia, ayuda a las empresas a encontrar y gestionar grandes franjas de documentos a gran velocidad y escala, permitiéndoles identificar, clasificar y extraer información de sus documentos.
La mayoría de las veces, los sistemas automatizados de clasificación de documentos proporcionan información superficial sobre la naturaleza de los documentos a través de etiquetas genéricas o enriquecimientos de metadatos. Esta clasificación superficial no tiene plenamente en cuenta el contenido del documento en sí, lo que significa que no se puede aprovechar el verdadero valor de los datos a menos que cada documento se evalúe manualmente.
La conclusión es que este proceso de evaluación manual de documentos para identificar tipos de documentos, detectar documentos extraviados y extraer detalles cruciales sería muy laborioso y llevaría mucho tiempo. Además, la falta de un manejo adecuado de los metadatos plantea posibles problemas con el RGPD y afecta negativamente la calidad de los datos para las tareas posteriores. Si no se resuelven, estos desafíos pueden amenazar el beneficio competitivo y la eficiencia de los clientes de DOC debido a estos problemas de calidad de datos y cumplimiento normativo.
Para hacer frente a estos obstáculos, DOC colaboró con IBM® Ecosystem Engineering Build Lab, IBM® Client Engineering e IBM® Technology Expert Labs para desarrollar un piloto que aprovecha una combinación de aprendizaje automático tradicional e IA generativa (modelos de lenguaje grandes, LLM) con IBM® watsonx.ai e IBM® Watson Discovery.
A través de un piloto de creación conjunta de 6 semanas, DOC desarrolló una solución de pipeline de datos impulsada por la plataforma IBM® Watson Discovery que emplea modelos de aprendizaje automático personalizados junto con el LLM Mixtral-8x7B de Mistral AI para clasificar documentos con etiquetas personalizadas y de metadatos. El enfoque del piloto se fijó en la industria inmobiliaria debido a la variedad de tipos de datos y requisitos normativos que enfrentan los clientes de DOC en este dominio. Este enfoque en la industria llevó a la creación de una capacidad adicional que amplió el alcance de la solución: el uso de LLM para extraer información valiosa, como las decisiones de la junta directiva, a partir de actas de reuniones.
El piloto demostró ser un gran éxito en términos de aumentos en la velocidad y calidad de la clasificación de documentos, así como insights de grandes volúmenes de documentos. Además, los resultados del piloto proporcionan una indicación clara de los beneficios de un enfoque combinado de aprendizaje automático tradicional e IA generativa, en el que las deficiencias de cada enfoque quedan cubiertas por las fortalezas del otro. Lo que antes tomaba a una persona unos minutos examinar manualmente un documento y clasificarlo, ahora puede tardar solo 2 segundos por documento a través de un proceso automatizado que requiere una evaluación humana solo para los documentos que el sistema marca como valores atípicos.
Con miras al futuro, DOC tiene como objetivo ampliar este piloto desarrollando aún más su solución para expandirla a otras industrias y segmentos de clientes.
Digital Office Company (DOC) (enlace externo a ibm.com) es una empresa finlandesa fundada en 1996 que ofrece soluciones modernas de gestión de la información para organizaciones de diferentes tamaños. Las oficinas están ubicadas en Espoo, Hämeenlinna, Lahti y Lappeenranta, Finlandia.
© Copyright IBM Corporation 2024. IBM, el logotipo de IBM, IBM® Watsonx y watsonx.ai son marcas comerciales o marcas comerciales registradas de IBM Corp. en Estados Unidos o en otros países. Es posible que otros nombres de productos y servicios sean marcas comerciales de IBM o de otras empresas. Una lista actualizada de marcas de IBM está disponible en https://www.ibm.com/mx-es/legal/copytrade. Este documento está vigente a partir de la fecha inicial de publicación, pero IBM puede modificarlo en cualquier momento. Los ejemplos presentados son solo ilustrativos. Los resultados reales variarán en función de las configuraciones y condiciones del cliente y, por lo tanto, no se pueden proporcionar resultados generalmente previstos. No todas las ofertas están disponibles en todos los países en los que opera IBM. El cliente es responsable de garantizar el cumplimiento de las leyes y reglamentos aplicables. IBM no brinda asesoría legal ni declara o garantiza que sus servicios o productos aseguren que el cliente cumpla con cualquier ley o reglamento. |