A precisão destes segmentos de usuários pode ter um impacto na geração de receitas, por isso é fundamental que Kanchwala e a sua equipe utilizem os dados mais precisos, otimizados para estas campanhas. Por exemplo, uma menor precisão nos modelos pode resultar numa campanha publicitária que sub-indexa o segmento que o cliente pretende atingir ou que não atinge o segmento de público-alvo pretendido.
Como eles usam pipelines de dados como Apache Airflow e Sagemaker para fazer essas previsões de modelo, os pipelines precisam ser confiáveis e os dados precisam ser precisos.
"Para nossa perspectiva, muitas decisões de negócios estão sendo tomadas nos segmentos e previsões que fazemos", diz Kanchwala. "À medida que construímos esses segmentos, nos esforçamos para garantir que os dados que entram nos pipelines de previsão sejam precisos, para que as previsões que saem desses pipelines sejam precisas. Qualquer perda de precisão aqui pode afetar as decisões de negócios ou os resultados financeiros de alguém.”
Como para a maioria das equipes de engenharia de dados e ML, foi um desafio acompanhar o desempenho do modelo ao longo do tempo e inserir alertas proativos para ser notificado quando ocorrem alterações. Se sua equipe não estiver ciente dos problemas de dados, um cliente poderá estar tomando decisões usando previsões baseadas em dados desatualizados ou menos relevantes.