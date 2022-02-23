Tag
think.analytics

Come garantire qualità, valore e affidabilità dei dati

Codifica e programmazione per sviluppatrici freelance

La qualità dei dati a valle dipende direttamente dalla qualità dei dati nel primo miglio. Già dall'ingestione, dati accurati e affidabili garantiranno che i dati utilizzati a valle per analytics, visualizzazione e data science siano di alto valore.

Per un'azienda, questo fa la differenza tra il trarre vantaggio dai dati e il farli passare in secondo piano quando si prendono le decisioni. In questo post, descriviamo l'importanza della qualità dei dati, come controllare e monitorare i dati e come ottenere il consenso da parte dei leader, dei colleghi e del consiglio di amministrazione.

Argomenti trattati:

  • Osservabilità proattiva dei dati
  • Verifica dei dati per la qualità
  • Qualità dei dati o valore dei dati?
  • Come approcciare i dirigenti e il consiglio di amministrazione
  • Come addestrare a livello interno
  • La maledizione dell'"Altro"
  • Le best practice per iniziare: garantire la qualità dei dati in tutta l'azienda

Osservabilità proattiva dei dati

Gestire i dati è come correre una maratona. Molti fattori determinano il risultato finale, ed è un processo lungo. Tuttavia, supponiamo che un corridore inciampi e si faccia male alla caviglia durante il primo chilometro. In tal caso non riuscirà a completare la maratona. Allo stesso modo, se i dati non vengono monitorati già dopo l'ingestione, il resto della pipeline ne risentirà negativamente.

Come possiamo garantire la governance dei dati durante questo primo miglio del percorso dati?

I dati entrano nella pipeline da varie fonti: API esterne, drop-up di dati da fornitori esterni, prelievi da un database e altre. Il monitoraggio dei dati nei punti di inserimento garantisce che gli ingegneri dei dati possano ottenere un'observability proattiva dei dati in arrivo.

Questo permette loro di gestire e correggere i dati per garantire che il processo sia integro e affidabile fin dall'inizio.

Ottenendo un'osservabilità proattiva delle pipeline di dati, i data engineer possono:

  • Fiducia nei dati
  • Identificare facilmente i punti di rottura
  • Risolvere rapidamente i problemi prima che arrivino al magazzino o al dashboard

Verifica dei dati per la qualità

I data engineer che desiderano rivedere la propria pipeline o verificare e monitorare una fonte di dati esterna possono utilizzare le seguenti domande durante la loro valutazione:

  1. Qual è l'ambito di copertura?
  2. Come vengono monitorati i dati?
  3. Esiste un riferimento ai dati master che includa requisiti e metadati?
  4. Il cliente è definito nel modo giusto?
  5. Esiste una gerarchia comune?
  6. Le tassonomie utilizzano le esigenze aziendali?
  7. Le geografie sono impostate correttamente?
  8. Ci sono dei duplicati?
  9. I dati sono stati cercati prima di creare nuove entità?
  10. I dati sono strutturati per consentire integrazioni e interoperabilità perfette?

Ora che abbiamo trattato il modo in cui gli ingegneri dei dati possono affrontare la qualità dei dati, vediamo come ottenere il consenso di altri stakeholder dell'azienda.

Qualità dei dati o valore dei dati?

Gli ingegneri dei dati parlano spesso della qualità dei dati. Tuttavia, cambiando la conversazione sul valore dei dati, ulteriori stakeholder delle organizzazioni potrebbero essere incoraggiati a partecipare in modo più significativo al processo dati. Questo è importante per ottenere attenzione, risorse e assistenza continua.

Per farlo, consigliamo di parlare di come i dati si allineano agli obiettivi aziendali. Altrimenti, gli stakeholder esterni potrebbero pensare che la conversazione ruoti solo attorno alla pulizia dei dati.

Quattro criteri con cui gli ingegneri e l'azienda possono determinare il valore dei dati:

  • Rilevanza: i dati soddisfano l'obiettivo aziendale?
  • Copertura: i dati coprono l'intero mercato, permettendo all'azienda di metterli in azione?
  • Struttura: i dati sono strutturati in modo che l'azienda possa utilizzarli?
  • Accuratezza: i dati sono completi e corretti?

Come approcciare i dirigenti e il consiglio di amministrazione

Spostando la conversazione sul valore dei dati anziché sulla loro qualità, si può incoraggiare il C-level e il consiglio di amministrazione a investire più risorse nella pipeline dei dati. Ecco come fare:

  1. Inizia dai motivi per cui gestire i dati è di importanza strategica per la tua impresa. Mostra come i dati possano aiutare a eseguire le intenzioni strategiche.
  2. Spiega come la gestione e l'analisi dei dati possono aiutare l'azienda ad arrivare dove deve arrivare. Mostra come i dati possono crescere, migliorare e proteggere l'azienda. Puoi intrecciare i quattro criteri precedenti per enfatizzare i tuoi punti.
  3. Collega i dati a reparti specifici. Mostra come i dati possano aiutare a migliorare l'efficienza operativa, far crescere le vendite e mitigare i rischi. Nessun altro dipartimento può affermare di contribuire a crescere, migliorare e proteggere tutti i dipartimenti nella stessa misura in cui può fare l'ingegneria dei dati.
  4. Non concentrarti sul processo e sulla tecnologia, altrimenti avrai un destinatario molto ristretto.

Come addestrare a livello interno

Oltre alla leadership aziendale, è anche importante coinvolgere le persone all'interno dell'azienda. Questo aiuterà nell'analisi e nel monitoraggio dei dati. I data engineer spesso hanno bisogno che i dipendenti dell'azienda partecipino allo sforzo continuo di mantenimento dei dati. Ad esempio, i venditori devono compilare più campi in un CRM quando aggiungono una nuova opportunità.

Consigliamo di investire tempo nella gestione delle persone, ad esempio nella formazione e assicurarci che tutti siano sulla stessa pagina sull'importanza della qualità dei dati. Ad esempio, spiegare come identificare correttamente le discrepanze possa aiutare a scoprire un'anomalia aziendale (piuttosto che un'anomalia dei dati, cosa che potrebbe accadere se le persone non aggiornano i dati in modo coerente e completo).

La maledizione dell'"Altro"

La verifica del valore dei dati è fondamentale perché ha un impatto diretto sulla capacità di prendere decisioni basate su di essi. Se hai bisogno di un esempio per convincere i dipendenti a partecipare alla gestione dei dati, ricorda loro "la maledizione dell'Altro".

Quando le unità di business come marketing, prodotto e vendite monitorano i dashboard e una grande porzione è denominata "Altro", non dispongono di tutti i dati di cui hanno bisogno e il loro processo decisionale risulta compromesso. Questo è il risultato della mancanza di gestione dei dati e di governance dei dati.

Best practice per iniziare: garantire la qualità dei dati in tutta l'azienda

Come possono i data engineer trasformare la qualità dei dati da una teoria astratta in pratica? Riassumiamo tutto ciò che abbiamo trattato in un piano fruibile.

Passaggio 1: verifica della situazione dei dati

Per prima cosa, valuta quali domini devono essere coperti e come vengono gestiti. Ciò include tipi di dati come:

  • Dati sulle relazioni con clienti, fornitori, partner, potenziali clienti, cittadini, pazienti e clienti
  • Dati del brand da prodotti, servizi, offerte, banner e altro ancora

Identifica gli errori nelle diverse fasi del gasdotto, partendo dall'ingestione.

Passaggio 2: metti in mostra la pipeline di dati

Presenta la situazione dei dati ai vari stakeholder. Mostra come vengono gestiti i dati dal punto di ingresso al prodotto finale. Quindi, spiega in che modo il valore attuale dei dati influisce sulle loro decisioni. Presenta i punti di errore e suggerisci modi per apportare correzioni.

Passaggio 3: assegnare priorità ai problemi da correggere

Costruisci un piano prioritizzato per promuovere il cambiamento. Determina quali problemi risolvere per primi. Includi l'identificazione delle fonti e il modo in cui inviano i dati, la gestione dei dati e la formazione dei dipendenti. Ottieni il consenso al piano e procedi con l'esecuzione.

Conclusione

Garantisci la qualità dei dati è responsabilità dei data engineer e dell'intera organizzazione. Il monitoraggio della qualità dei dati inizia dalla fonte. Tuttavia, ottenendo il consenso di dipendenti e dirigenti, i data engineer possono assicurarsi di ricevere le risorse e l'attenzione necessarie per monitorare e risolvere i problemi di dati durante tutta la pipeline, e aiutare l'azienda a crescere.

Scopri di più sulla piattaforma di osservabilità continua dei dati di IBM® Databand e su come aiuta a rilevare gli incidenti di dati in anticipo, a risolverli più rapidamente e a fornire dati più affidabili all'azienda. Se desideri approfondire ulteriormente l'argomento, prenota subito una demo.

 