Steve Gotlieb est directeur en chef de l’ingénierie des données et de la visualisation chez Autodesk, une société multinationale qui fournit des produits logiciels dans de nombreux secteurs d’activité. Il dirige l’équipe chargée de l’ingénierie des données et de la plateforme en Amérique du Nord et à Singapour. Son équipe se consacre à la conception de composants réutilisables destinés à créer une plateforme de données robuste et fiable, capable de soutenir des solutions fondées sur les données.
Sous la direction de Steve, la qualité des données est devenue un élément essentiel de la plateforme, permettant de soutenir les concepts de maillage des données qui favorisent une approche « d’apport de ses propres données » et facilitent l’intégration et l’utilisation des données dans l’ensemble de l’organisation.
L’équipe de Steve et les autres équipes d’ingénierie des données d’Autodesk ont dû faire face à un défi de taille : elles étaient souvent les dernières à être informées des problèmes de données. L’équipe de Steve était obligée d’adopter une approche réactive pour résoudre les problèmes, qu’il s’agisse de données manquantes, de données en retard ou obsolètes, ou de données incorrectes contenant des valeurs nulles.
Le temps que l’équipe prenne conscience d’un problème de données, celui-ci pouvait être apparu il y a un mois ou plus, ce qui coûtait à l’entreprise un temps et des ressources précieux.
« Nous disposions auparavant d’un système de gestion de la qualité des données (DQM) sur mesure, mais cette solution était passive et non évolutive, explique Steve. Le système DQM s’appuyait sur l’exécution de requêtes pour contrôler le nombre d’exécutions, mais il ne détectait pas de manière proactive les problèmes de qualité des données. Les notifications concernant les problèmes de données étaient incohérentes et tardives, et arrivaient souvent par e-mail ou par des messages Slack sans que l’on sache exactement qui en était responsable. »