Riconoscendo la necessità di un approccio più proattivo, Steve e il suo team hanno iniziato a valutare le soluzioni di osservabilità dei dati. Ne hanno analizzate diverse, tra cui Monte Carlo Data e Datafold, ma il software di osservabilità IBM Databand si è distinto. La cultura dell'innovazione di Autodesk ha portato Autodesk a organizzare uno sprint di innovazione, riunendo team interfunzionali per esplorare e mostrare potenziali soluzioni. Preeti Taneja, Principal Data Engineer di Autodesk, ha svolto un ruolo fondamentale in questa valutazione. Il suo team ha avuto solo una settimana per dimostrare come Databand avrebbe trasformato i processi di qualità dei dati.
Hanno valutato se Databand fosse in grado di rilevare le modifiche nei sistemi di origine e fornire avvisi in tempo reale in caso di errori del workflow. Il risultato è stato impressionante. La perfetta integrazione di Databand con il moderno stack di dati di Autodesk, ad esempio Apache Airflow, dbt, Spark e Snowflake, e la capacità di inviare avvisi istantanei hanno fatto colpo.
"La facilità di integrazione di Databand con il nostro moderno stack di dati ci ha permesso di vederne immediatamente il valore", afferma Preeti. "Quando abbiamo iniziato a ricevere gli avvisi istantanei, è stato un vero e proprio momento di rivelazione delle capacità di qualità dei dati proattiva di Databand".
A seguito di una valutazione interna, Databand si è classificato come vincitore, portando il team a proseguire con la sua implementazione.
Il team di Steve utilizza Databand quotidianamente per monitorare gli incidenti legati ai dati in vari casi d'uso, tra cui:
- Monitoraggio dell'elaborazione in batch: Databand è ampiamente utilizzato per monitorare l'elaborazione dei lotti di produzione. Oltre 1.000 DAG vengono monitorati attivamente da Databand.
- Test in linea: il team utilizza le funzionalità di test in linea di Databand per rilevare i problemi di qualità dei dati in tempo reale, una capacità fondamentale per mantenere l'integrità dei dati.
- Supporto dei prodotti di dati: Databand supporta pipeline che forniscono insight e messaggistica all'interno del prodotto per i clienti di Autodesk.
- Monitoraggio delle pipeline di machine learning (ML) e AI: Databand monitora anche le pipeline a supporto dei team di ML e AI, garantendo che la qualità dei dati sia preservata in tutte le fasi dell'elaborazione dei dati.