Un prodotto di dati è un pacchetto riutilizzabile e autonomo che combina dati, metadati, semantica e modelli per supportare diversi casi d'uso aziendali. Può includere componenti quali set di dati, dashboard, report, modelli di machine learning (ML), query predefinite o pipeline di dati.
I prodotti di dati sono sviluppati con un approccio orientato al prodotto e applicando i principi tradizionali di sviluppo del prodotto. Questo approccio prevede la comprensione delle esigenze degli utenti, la priorità delle caratteristiche di alto valore e l'iterazione in base al feedback. In definitiva, tratta i dati come un prodotto progettato per risolvere problemi specifici degli utenti.
I prodotti di dati sono progettati per essere rilevabili, interoperabili e fruibili. Consentono a tutti, dagli utenti aziendali e analisti di dati ai data scientist, ai data steward e agli ingegneri, di estrarre un valore significativo dai dati intrappolati in un'azienda.
Il concetto di prodotti di dati ha acquisito importanza nel 2019 quando Zhamak Dehghani, direttore della tecnologia della società di consulenza IT ThoughtWorks, ha introdotto i prodotti di dati quale componente principale dell'architettura data mesh. Un data mesh è un'architettura di dati decentralizzata che organizza i dati in base a specifici domini aziendali come marketing, vendite e servizio clienti per dare maggiore controllo ai produttori di un determinato set di dati.
Per funzionare in modo efficace, un prodotto di dati deve presentare alcune caratteristiche chiave:
Gli stakeholder dovrebbero essere in grado di scoprire e trovare facilmente il prodotto di dati giusto per il loro caso d'uso.
Un prodotto di dati dovrebbe includere metadati chiari ed essere strutturato in base a domini aziendali specifici, consentendo ai consumatori di dati e ai team di dominio di interpretare e applicare le informazioni in modo efficace.
I prodotti di dati devono integrarsi perfettamente con altri sistemi per fornire insight coerenti su tutte le piattaforme.
I prodotti di dati devono essere confezionati come un'unità coesa che può essere distribuita facilmente in tutta l'organizzazione, garantendo un utilizzo e una comprensione uniformi tra i team.
Un prodotto di dati dovrebbe disporre di controlli di accesso e misure di sicurezza per garantire che solo gli utenti autorizzati possano accedere ai dati, mantenendo al contempo la conformità.
Un prodotto di dati ben progettato è costituito da componenti modulari che possono essere riutilizzati per creare nuovi prodotti di dati o insight derivati, aumentando l'efficienza e riducendo gli sforzi ridondanti.
McKinsey riporta che le aziende basate sui dati hanno 23 volte più probabilità di acquisire clienti e 19 volte più probabilità di essere redditizie. Tuttavia, nonostante la crescente domanda di processo-decisionale basato sui dati, molte organizzazioni continuano a incontrare ostacoli quali silos di dati, vendor lock-in e rischi di conformità dovuti a framework di governance dei dati insufficienti.
Per affrontare queste sfide, alcune organizzazioni hanno adottato un approccio data-as-a-product, trattando i dati come un asset gestito e consumabile piuttosto che un sottoprodotto delle operazioni.
Le metodologie data-as-a-product enfatizzano la strutturazione e la gestione dei dati per informare le decisioni aziendali e migliorare l'esperienza degli utenti. Partendo da quella base, i prodotti di dati forniscono un approccio strutturato e self-service alla gestione dei dati, riducendo la dipendenza dai team tecnici e supportando il processo decisionale in tempo reale.
Le organizzazioni che investono in prodotti di dati possono ottenere miglioramenti a livello di accesso ai dati, interoperabilità,data storage e governance dei dati. In tutti i settori, i prodotti di dati hanno il potenziale per migliorare l'automazione, supportare il processo decisionale basato sui dati e aiutare le aziende ad allineare le proprie strategie di dati agli obiettivi aziendali a lungo termine. Utilizzando piattaforme dati affidabili, modelli di machine learning e strumenti di visualizzazione , le organizzazioni possono consentire ai team di utilizzare al meglio i propri dati.
I prodotti di dati spesso ottengono questi vantaggi conferendo poteri a vari ruoli all'interno di un'organizzazione:
Il modo in cui le organizzazioni gestiscono i dati si è evoluto da un approccio passivo basato sugli asset a una strategia attiva e basata sui prodotti.
Tradizionalmente, le aziende hanno sempre trattato i dati come qualcosa da raccogliere e memorizzare. Questo approccio mette i dati in un data warehouse o in un source system centrale, organizzandoli per area tematica (come finanza o marketing) e assegnando la proprietà a team centralizzati. Il successo si misura spesso in base al volume di dati, ad esempio i terabyte memorizzati, con la speranza che, semplicemente disponendo di più dati, i dipendenti li utilizzino.
Tuttavia, i metadati sono in genere definiti dai reparti IT e non sono di facile utilizzo per i consumatori di dati. Di conseguenza, molti attività che coinvolgono asset di dati ruotano attorno ad analytics descrittive e reporting, guardando indietro a ciò che è accaduto anziché utilizzare i dati in modo proattivo per risolvere le problematiche aziendali.
Al contrario, considerando i dati come un prodotto si sposta l'attenzione dallo storage all'utilizzo e alla creazione di valore. I prodotti di dati attraversano uno specifico ciclo di vita e sono progettati, testati e iterati proprio come i prodotti software che seguono una metodologia agile o DataOps.
La proprietà è specifica del dominio (ad esempio, un prodotto di dati di marketing gestito da esperti di marketing), che mantiene i dati pertinenti e di alta qualità. I dati sono inoltre curati per esigenze di consumo specifiche, con metadati ricchi basati sull'azienda. Ciò garantisce che i prodotti di dati siano facilmente individuabili e comprensibili dagli utenti aziendali.
Poiché i proprietari dei dati si assumono la responsabilità dei prodotti di dati, viene effettuato un monitoraggio continuo dell'utilizzo, della qualità e del valore derivati da un prodotto tramite feedback con gli utenti finali.
Il successo si misura in base a come i dati migliorano il processo decisionale, generano fatturato o riducono i costi, piuttosto che semplicemente in base a quanti terabyte vengono memorizzati. Di conseguenza, le iniziative relative ai prodotti di dati possono risolvere le domande aziendali con analytics avanzate, come la modellazione predittiva e prescrittiva.
Un prodotto di dati ben strutturato è costituito da diversi componenti che consentono funzionalità e usabilità all'interno dell'ecosistema di dati di un'organizzazione:
I prodotti di dati possono essere categorizzati in base alla qualità dei dati e ai livelli di perfezionamento. I tipi di prodotti di dati includono:
Prodotti di dati dai sistemi di origine. Questo tipo di prodotto di dati grezzi (o con trasformazione minima) rappresenta spesso l'elemento fondamentale per casi d'uso quali data science e AI generativa.
Prodotti di dati che sono stati curati e consolidati in dati master che standardizzano le principali entità aziendali (come clienti o prodotti) per garantire la coerenza tra i sistemi.
Prodotti di dati raffinati, elaborati e progettati per supportare il processo decisionale e generare insight fruibili.
Seguendo un ciclo di vita strutturato di gestione dei prodotti, i team di dati possono creare prodotti di dati che abbiano un valore continuo e siano scalabili e in linea con le esigenze aziendali in evoluzione.
Le fasi chiave del ciclo di vita di un prodotto di dati includono:
Le organizzazioni di tutti i settori si affidano ai prodotti di dati per generare valore aziendale, supportare le iniziative strategiche e risolvere problemi aziendali critici.
Esempi reali di prodotti di dati includono:
Per sviluppare con successo prodotti di dati è necessario un approccio strategico che includa la comprensione del consumo dei dati, la mappatura delle interazioni dei dati, la verifica del valore di mercato e l'iterazione per la scalabilità.
Il primo passo per creare un prodotto di dati è l'analisi del consumo dei dati all'interno dell'organizzazione. Questo passaggio prevede l'identificazione degli utenti target, la comprensione dei dati che consumano e il motivo per cui tali dati sono importanti per loro.
La revisione dell'utilizzo dei dati in termini di volume, frequenza, sensibilità e tipo fornisce insight su quali set di dati hanno il maggior valore. Dando priorità ai gruppi di utenti ad alto impatto, le organizzazioni possono contribuire a garantire che gli sforzi iniziali si concentrino sulle aree con il maggiore potenziale di impatto sul business.
Una volta che i modelli di consumo dei dati sono chiari, il passo successivo è la mappatura del percorso dei dati. La creazione di mappe dettagliate delle interazioni con i dati del mondo reale aiuta a visualizzare il flusso dei dati tra diversi sistemi e team.
Queste mappe possono fungere da base per il brainstorming di nuovi casi d'uso che generano entrate per i prodotti di dati. Sviluppare ipotesi su come i prodotti di dati possono migliorare i processi aziendali può aiutare le organizzazioni a iniziare a esplorare modi per trasformare i dati non elaborati in insight significativi e fruibili.
Una volta convalidati gli insight, il passo successivo consiste nel ripetere e ampliare. Invece di affidarsi esclusivamente ai team IT centrali, le organizzazioni possono promuovere l'agilità e l'innovazione dando la possibilità ai settori e ai team aziendali di perfezionare e migliorare il prodotto di dati. Una volta apportati i miglioramenti, il progetto può essere esteso a più team e domini, assicurando che il prodotto di dati sia scalabile in modo efficace e continui a generare valore aziendale.
Gestisci i dati come un prodotto durante il loro intero ciclo di vita. Gestisci il ciclo di vita dei prodotti di dati, dall'integrazione alla dismissione, con un solido sistema per il controllo delle versioni, la manutenzione e l'aggiornamento dei prodotti di dati.
Trasforma rapidamente i dati non elaborati in insight fruibili, unifica governance, qualità, lineage e condivisione dei dati e offri agli utenti dati affidabili e contestualizzati.
Sblocca il valore dei dati aziendali con IBM Consulting e crea un'organizzazione basata su insight in grado di generare vantaggi aziendali.