¿El resultado? Cloud Pak for Data de IBM y su solución Watson Knowledge Catalog demostraron ser las más escalables. "En particular, la mayoría de las soluciones que revisamos tenían problemas: algunas se limitaban solo a manejar metadatos, para otras tuvimos que adquirir productos adicionales para el linaje de datos y en otros casos los datos necesitaban procesamiento y no se podían usar de inmediato. Cloud Pak for Data de IBM es la única que no tiene ninguno de esos problemas”, dijo Sanghee Han, director del proyecto, Samsung-Electro Mechanics.
Una ventaja adicional fue la capacidad de ejecutar y escalar SPSS, además de visualizar los datos en paneles a través de portátiles Jupyter con Cloud Pak for Data de IBM. El equipo de Samsung Electro-Mechanics también creó un portal en el front-end de la solución para crear, agregar, complementar y controlar las funciones que necesitaban, como construir árboles usando datos, dibujar mapas de datos e incluir características de seguridad adicionales. El hecho de que se pudiera personalizar según las necesidades de la empresa y que fuera fácil de usar en conjunto con sus propios sistemas, fue una gran ventaja.
La conexión con Impala, SAP Hana, Oracle, MS SQL y otros servidores de bases de datos fue exitosa a pesar de los problemas técnicos iniciales en la importación de activos o el uso de funciones. La participación activa de IBM Korea para brindar soporte técnico proactivo permitió al equipo de Samsung Electro-Mechanics resolver los problemas técnicos. El trabajo de desarrollo comenzó en octubre de 2021 con la primera fase abierta para pruebas en diciembre. El proyecto real tardó unos 6 meses en completarse. El lanzamiento oficial tuvo lugar el 22 de abril de 2022.
Hoy en día, la plataforma basada en IBM Cloud Pak for Data toma los datos generados a partir de múltiples fuentes y los organiza en activos sistemáticos que se pueden compartir, buscar y utilizar con facilidad a través de API en toda la organización. La información personal y confidencial se gestiona de acuerdo con los estrictos principios de gobernanza de Samsung Electro-Mechanics. En cuanto a los activos de datos, se actualizan continuamente con datos recién generados. El número de estos activos de datos creció de 500 a más de 2500 y sigue en aumento.
Lo mejor de crear una plataforma de datos con Cloud Pak for Data de IBM es proporcionar a los usuarios funciones de autoservicio. Los usuarios pueden encontrar los datos que necesitan con rapidez, procesarlos de la forma que deseen y emplearlos de inmediato, en lugar de tener que pedir a los desarrolladores que extraigan los datos, lo que tardaría días. Esto permitió que los usuarios completaran tareas que normalmente tardaban 30 días en 10 días o menos.
“Un compañero de trabajo dijo que lo que antes se hacía en una semana ahora se puede hacer en un día. Si bien el tiempo necesario depende del tipo de datos, la productividad general de los empleados mejoró y pueden extraer información útil. En los casos de clientes que solicitan datos específicos, nuestro equipo puede encontrar, analizar y entregar los datos de manera rápida y eficiente, lo que ha contribuido a mejorar la satisfacción no solo de nuestros empleados sino también de nuestros clientes.
“A esto se le suma que la cantidad de datos que se puede emplear en el lago de datos del sistema de materia prima, que representa la mayor parte del corpus de datos de Samsung Electro-Mechanics, aumentó de forma significativa. Ahora es posible buscar y utilizar no solo datos y archivos estructurados, sino también imágenes y datos no estructurados a través del portal conectado, lo que representa otro resultado importante de este proyecto”, comentó Sanghee Han, director del proyecto, Samsung-Electro Mechanics.
Samsung Electro-Mechanics tiene previsto seguir ampliando la plataforma de datos en función del éxito del proyecto. El número de sistemas de datos conectados a la solución pasó de cinco o seis al principio a más de 20 en la actualidad. Aunque actualmente la están utilizando principalmente en el área de DataOps, en cooperación con científicos de datos, hay planes para utilizarla en el área de MLOps.
"Crearla desde cero y configurar el proceso fue más difícil de lo que pensaba, porque este tipo de proceso de innovación no es algo que hagamos todos los días; pero me siento muy gratificado, porque los usuarios están muy satisfechos y lo usan mejor de lo que esperaba al principio", concluyó Sanghee Han, director del proyecto, Samsung-Electro Mechanics.