L'accuratezza di questi segmenti di utenti può avere un impatto sulla generazione di entrate, quindi è fondamentale che Kanchwala e il suo team utilizzino i dati più accurati, ottimizzati per queste campagne. Ad esempio, una minore precisione dei modelli può portare a campagne pubblicitarie sottoindicizzate rispetto al segmento che il cliente intende raggiungere o che non raggiungono il segmento di pubblico previsto.
Poiché per effettuare queste previsioni del modello utilizzano pipeline di dati come Apache Airflow e Sagemaker, le pipeline devono essere affidabili e i dati devono essere accurati.
"Dal nostro punto di vista, molte decisioni aziendali vengono prese in base ai segmenti e alle previsioni che facciamo", afferma Kanchwala. "Nella costruzione di questi segmenti, ci impegniamo a garantire che i dati inseriti nelle pipeline di previsione siano accurati, in modo che le previsioni da esse ottenute siano accurate. Qualsiasi perdita di precisione, in questo caso, avrebbe un grave impatto sulle decisioni aziendali o sui profitti di qualcuno".
Come per la maggior parte dei team di data engineering e ML engineering, era difficile monitorare le prestazioni del modello nel tempo e inserire avvisi proattivi per sapere quando si verificano cambiamenti. Se il suo team non è consapevole dei problemi legati ai dati, il cliente potrebbe prendere decisioni utilizzando previsioni basate su dati obsoleti o poco rilevanti.