La précision de ces segments d’utilisateurs peut avoir un impact sur la génération de revenus, il est donc essentiel que M. Kanchwala et son équipe utilisent les données les plus exactes possibles, et qu’elles soient optimisées pour ces campagnes. Par exemple, des modèles moins précis pourraient entraîner une campagne publicitaire qui ne correspondrait pas au segment que le client souhaite atteindre ou qui n’atteindrait pas le segment de public visé.
Ils utilisent des pipelines de données comme Apache Airflow et Sagemaker pour effectuer ces prédictions de modèles. Par conséquent, les pipelines doivent être fiables et les données doivent être précises.
« Dans notre activité, de nombreuses décisions métier sont prises en fonction des segments et des prévisions que nous formulons », explique M. Kanchwala. « Lorsque nous créons ces segments, nous nous efforçons de nous assurer que les données qui entrent dans les pipelines de prédiction sont exactes afin que les prédictions qui en sortent soient exactes. Toute perte de précision pourrait avoir un impact sur les décisions métier ou les résultats d’une entreprise. »
Comme c’est le cas pour la plupart des équipes d’ingénierie de données et de ML, il a été difficile de suivre les performances du modèle au fil du temps et de générer des alertes proactives pour être averti en cas de changement. Si son équipe n’est pas consciente des problèmes qui existent au niveau des données, un client pourrait alors prendre des décisions en s’appuyant sur des prédictions basées sur des données obsolètes ou moins pertinentes.