Die Genauigkeit dieser Nutzersegmente kann sich auf die Umsatzgenerierung auswirken. Daher ist es entscheidend, dass Kanchwala und sein Team die genauesten Daten verwenden, die für diese Kampagnen optimiert sind. Eine geringere Genauigkeit der Modelle könnte zum Beispiel zur Folge haben, dass eine Werbekampagne das Segment, das der Kunde erreichen möchte, nicht ausreichend anspricht oder dass das beabsichtigte Zielgruppensegment nicht erreicht wird.
Da sie Daten-Pipelines wie Apache Airflow und Sagemaker verwenden, um diese Modellvorhersagen zu erstellen, müssen die Pipelines zuverlässig und die Daten präzise sein.
„Aus unserer Sicht werden viele Geschäftsentscheidungen auf der Grundlage der Segmente und Vorhersagen getroffen, die wir machen“, sagt Kanchwala. „Beim Aufbau dieser Segmente achten wir darauf, dass die Daten, die in die Vorhersagepipelines eingespeist werden, korrekt sind, damit die Vorhersagen, die aus diesen Pipelines kommen, korrekt sind. Jeder Verlust an Genauigkeit könnte sich auf die Geschäftsentscheidungen oder das Endergebnis auswirken.“
Wie für die meisten Daten- und ML-Engineering-Teams war es eine Herausforderung, die Modellleistung im Laufe der Zeit zu verfolgen und proaktive Warnmeldungen zu erzeugen, um bei Änderungen benachrichtigt zu werden. Wenn sein Team nicht weiß, dass es Datenprobleme gibt, könnte ein Kunde Entscheidungen auf der Grundlage von Prognosen treffen, die auf veralteten oder weniger relevanten Daten basieren.