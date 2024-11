Alcuni anni fa, un'innocua modifica della configurazione di Microsoft Dynamics CRM di un importante rivenditore ha fatto sì che il numero di inventario visualizzato su ogni articolo online smettesse di riflettere la realtà. Il contatore ha semplicemente smesso di aggiornarsi.

La gente ha continuato ad acquistare, ma il volume è rimasto costante. Quando il team di ingegneria dei dati è stato avvisato, le cose si erano ormai messe male.

La maggior parte degli articoli era disponibile per l'acquisto online, ma anche per il ritiro in negozio. Molte persone hanno scelto il ritiro in negozio. Gli ordini sono stati elaborati e gli articoli che non esistevano sono stati comunque venduti. Quindi i consumatori si sono recati nei negozi, dove gli addetti alla vendita al dettaglio si affannavano a trovare prodotti sostitutivi o a promettere sconti o a tranquillizzarli in qualche modo. Si sono formate delle code. I visitatori dei negozi hanno dovuto aspettare per effettuare i loro acquisti e sono stati scoraggiati da così tante persone che si agitavano con rabbia sui loro telefoni. E poiché ci sono voluti giorni per scoprire il problema e per riparare la pipeline, c'è voluto dell'altro tempo prima che la situazione si risolvesse.

Tenendo conto della perdita di reputazione del marchio, l'errore è costato decine di milioni e non sarebbe dovuto accadere.

Tutto questo per dire che i problemi relativi ai dati si aggravano. Possono essere difficili da individuare e affrontare e, di conseguenza, crescere inosservati. È facile cadere nella convinzione che tutto funzioni solo perché si continuano a ricavare alcuni insight, anche se si sta accumulando una quantità crescente di debiti di dati sotterranei.

Inoltre, i segnali più veritieri di problemi di qualità dei dati tendono a essere indicatori in ritardo. Ad esempio, i consumatori che ti avvisano. O, come nell'esempio precedente del CRM per la vendita al dettaglio, migliaia di manager e vicepresidenti regionali che ti avvisano. E questo non va bene. Significa che i dati sono nel tuo sistema da tempo e che ci vorranno giorni prima che una correzione produca risultati. Si tratta di non soddisfare le aspettative dei consumatori.

Questa è la situazione in cui si è trovata la startup di spedizioni Shipper e il motivo per cui hanno investito così tanto per evitare che si verificasse. Il loro team di ingegneria dei dati fornisce dati il più possibile in tempo reale a un'applicazione che aiuta i fornitori di e-commerce a consegnare il loro inventario a un porto di spedizione. Non devono preoccuparsi solo delle aspettative dei loro consumatori, ma anche di quelle dei consumatori dei loro consumatori. E quando il loro sistema, a volte, non era aggiornato da due giorni, si creava un'ondata di aspettative mancate. Per questo motivo, hanno investito molto nella gestione della qualità dei dati e in strumenti in grado di fornire avvisi tempestivi con controlli automatici.

La gestione della qualità dei dati è un modo per rendere automatici e pervasivi i controlli sulla qualità dei dati, in modo da combattere le forze dell'entropia sui set di dati e sulle pipeline con una forza uguale e contraria.