Steve Gotlieb und sein Team begannen mit der Auswertung von Lösungen zur Datenbeobachtung und erkannten die Notwendigkeit eines proaktiveren Ansatzes. Sie prüften verschiedene Optionen, darunter die Lösung von Monte Carlo Data und Datafold, aber die IBM® Databand®-Beobachtungssoftware hob sich von den anderen ab. Die Innovationskultur von Autodesk führte dazu, dass das Unternehmen einen Innovations-Sprint veranstaltete, bei dem funktionsübergreifende Teams zusammenkamen, um potenzielle Lösungen zu erarbeiten und vorzustellen. Preeti Taneja, Principal Data Engineer bei Autodesk, spielte bei dieser Bewertung eine entscheidende Rolle. Ihr Team hatte nur eine Woche Zeit, um aufzuzeigen, wie Databand seine Datenqualitätsprozesse transformieren könnte.
Dabei wurde geprüft, ob Databand Änderungen in Quellsystemen erkennen und bei Workflow-Fehlern Echtzeit-Warnmeldungen ausgeben kann. Das Ergebnis war beeindruckend. Die nahtlose Integration von Databand in den modernen Data-Stack von Autodesk, z. B. Apache Airflow, dbt, Spark und Snowflake, und die Fähigkeit, sofortige Warnmeldungen zu senden, hinterließen einen nachhaltigen Eindruck.
„Die einfache Integration von Databand in unseren modernen Datenstapel ermöglichte es uns, den Wert sofort zu erkennen“, sagt Preeti Taneja. „Als wir anfingen, sofortige Warnungen zu erhalten, war das ein echter Wow-Moment für die proaktiven Datenqualitätsfunktionen von Databand.“
Nach einer internen Bewertung ging Databand als klarer Sieger hervor, was das Team dazu veranlasste, mit der Umsetzung fortzufahren.
Gotliebs Team nutzt Databand täglich, um Datenvorfälle in verschiedenen Anwendungsfällen zu überwachen, darunter:
- Überwachung der Batch-Verarbeitung: Databand wird häufig zur Überwachung der Batch-Verarbeitung in der Produktion eingesetzt. Über 1.000 DAGs werden aktiv von Databand überwacht.
- Inline-Tests: Das Team nutzt die Inline-Testfunktionen von Databand, um Probleme mit der Datenqualität in Echtzeit zu erkennen, was für die Aufrechterhaltung der Datenintegrität von entscheidender Bedeutung ist.
- Unterstützung von Datenprodukten: Databand unterstützt Pipelines, die Erkenntnisse und produktinterne Nachrichten für Autodesk-Kunden bereitstellen.
- Überwachung von maschinellem Lernen (ML) und KI-Pipelines: Databand überwacht auch Pipelines, die ML- und KI-Teams unterstützen, und trägt so dazu bei, dass die Datenqualität in allen Phasen der Datenverarbeitung gewährleistet ist.