Au terme de cette évaluation, la solution Cloud Pak for Data d’IBM et son outil Watson Knowledge Catalog se sont avérés les plus évolutifs. « La plupart des solutions que nous avons examinées présentaient des problèmes : elles se limitaient au traitement des métadonnées ou bien nous aurions dû acheter des produits supplémentaires pour la traçabilité des données, ou alors les données devaient subir un traitement avant de pouvoir être utilisées. Seul Cloud Pak for Data d’IBM ne présentait aucun problème de ce type », souligne Sanghee Han, chef de projet chez Samsung-Electro Mechanics.
Avec Cloud Pak for Data d’IBM, il était aussi possible d’exécuter et de faire évoluer SPSS et de visualiser les données sur des tableaux de bord via des Jupyter notebooks. L’équipe de Samsung Electro-Mechanics a également créé un portail sur le front-end de la solution pour créer, ajouter, étoffer et contrôler les fonctions dont elle avait besoin, comme la construction d’arborescences à l’aide de données, le dessin de cartes de données et le renforcement de la sécurité. Ses capacités de personnalisation en fonction des besoins de l’entreprise et sa facilité d'utilisation en conjonction avec ses propres systèmes étaient un autre avantage de taille.
Malgré les défis techniques initiaux liés à l'importation d'actifs ou à l'utilisation de fonctions, la connexion avec Impala, SAP Hana, Oracle, MS SQL et d'autres serveurs de bases de données a été un succès. L'implication active d'IBM Corée dans la fourniture d'un support technique proactif a permis à l'équipe Samsung Electro-Mechanics de résoudre les problèmes techniques. Les travaux de développement ont commencé en octobre 2021 et la première phase a été ouverte aux tests en décembre de la même année. Le projet lui-même a pris environ 6 mois pour être achevé, avec un déploiement officiel le 22 avril 2022.
Aujourd'hui, cette plateforme basée sur IBM Cloud Pak for Data organise les données générées par différentes sources en actifs systématiques qui peuvent être facilement partagés, trouvés et utilisés via des API dans toute l’organisation. Les informations personnelles et sensibles sont gérées selon les principes de gouvernance stricts de Samsung Electro-Mechanics, et les actifs de données sont continuellement mis à jour avec les données nouvellement générées. Le nombre de ces actifs de données est passé de 500 à plus de 2 500, et ce chiffre continue de croître.
Cloud Pak for Data d’IBM a pour grand avantage de fournir aux utilisateurs des fonctions en libre-service. Les utilisateurs peuvent trouver rapidement les données dont ils ont besoin, les traiter sous la forme souhaitée et les utiliser immédiatement, au lieu de devoir demander aux développeurs de les extraire, ce qui aurait pris des jours. Résultat ? Ces tâches qui prenaient généralement de 30 jours sont bouclées en 10 jours ou moins.
« Un collègue nous a dit que ce qui prenait auparavant une semaine pouvait être accompli en une journée. Bien que le temps nécessaire dépende du type de données, la productivité globale des employés s'est améliorée et ils sont en mesure d'en tirer des informations très utiles. Dans le cas de données spécifiques demandées par les clients, notre équipe peut trouver, analyser et livrer ces données rapidement et efficacement, ce qui a contribué à la satisfaction non seulement de nos employés, mais aussi de nos clients. »
« De plus, la quantité de données pouvant être utilisées dans le data lake à partir du système de matières premières, qui constitue la plus grande partie du corpus de données de Samsung Electro-Mechanics, a considérablement augmenté. Il est désormais possible de rechercher et d’exploiter des données et des fichiers structurés, mais aussi des images et des données non structurées via le portail connecté : c'est une autre réussite phare de ce projet », se réjouit Sanghee Han, chef de projet chez Samsung-Electro Mechanics.
Fort de ce succès, Samsung Electro-Mechanics prévoit de continuer à développer cette plateforme de données. Aujourd'hui, plus de 20 systèmes de données sont connectés à la solution (contre cinq ou six par le passé). Si la plateforme est principalement utilisées pour le DataOps en collaboration avec les data scientists pour le moment, il est prévu d'étendre son l'utilisation au MLOps.
« La création et la mise en place des processus ont été plus difficiles que je ne le pensais, car ce type d’innovation n’est pas quelque chose que nous faisons tous les jours, mais nos efforts en valaient la peine. Nos utilisateurs sont très satisfaits et en font une utilisation qui dépasse mes attentes », conclut Sanghee Han, chef de projet chez Samsung-Electro Mechanics.