Cos'è un prodotto di dati?

Rack per server dati

Autori

Tom Krantz

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Cos'è un prodotto di dati?

Un prodotto di dati è un pacchetto riutilizzabile e autonomo che combina dati, metadati, semantica e modelli per supportare diversi casi d'uso aziendali. Può includere componenti quali set di dati, dashboard, report, modelli di machine learning (ML), query predefinite o pipeline di dati

I prodotti di dati sono sviluppati con un approccio orientato al prodotto e applicando i principi tradizionali di sviluppo del prodotto. Questo approccio prevede la comprensione delle esigenze degli utenti, la priorità delle caratteristiche di alto valore e l'iterazione in base al feedback. In definitiva, tratta i dati come un prodotto progettato per risolvere problemi specifici degli utenti. 

I prodotti di dati sono progettati per essere rilevabili, interoperabili e fruibili. Consentono a tutti, dagli utenti aziendali e analisti di dati ai data scientistai data steward e agli ingegneri, di estrarre un valore significativo dai dati intrappolati in un'azienda. 

Il concetto di prodotti di dati ha acquisito importanza nel 2019 quando Zhamak Dehghani, direttore della tecnologia della società di consulenza IT ThoughtWorks, ha introdotto i prodotti di dati quale componente principale dell'architettura data mesh. Un data mesh è un'architettura di dati decentralizzata che organizza i dati in base a specifici domini aziendali come marketing, vendite e servizio clienti per dare maggiore controllo ai produttori di un determinato set di dati

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI


Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think. 

Caratteristiche principali di un prodotto di dati

Per funzionare in modo efficace, un prodotto di dati deve presentare alcune caratteristiche chiave:

Reperibile

Gli stakeholder dovrebbero essere in grado di scoprire e trovare facilmente il prodotto di dati giusto per il loro caso d'uso. 

Comprensibile

Un prodotto di dati dovrebbe includere metadati chiari ed essere strutturato in base a domini aziendali specifici, consentendo ai consumatori di dati e ai team di dominio di interpretare e applicare le informazioni in modo efficace. 

Interoperabile

I prodotti di dati devono integrarsi perfettamente con altri sistemi per fornire insight coerenti su tutte le piattaforme. 

Condivisibile

I prodotti di dati devono essere confezionati come un'unità coesa che può essere distribuita facilmente in tutta l'organizzazione, garantendo un utilizzo e una comprensione uniformi tra i team. 

Proteggi

 Un prodotto di dati dovrebbe disporre di controlli di accesso e misure di sicurezza per garantire che solo gli utenti autorizzati possano accedere ai dati, mantenendo al contempo la  conformità

Riutilizzabile

Un prodotto di dati ben progettato è costituito da componenti modulari che possono essere riutilizzati per creare nuovi prodotti di dati o insight derivati, aumentando l'efficienza e riducendo gli sforzi ridondanti. 

Perché i prodotti di dati sono importanti?

McKinsey riporta che le aziende basate sui dati hanno 23 volte più probabilità di acquisire clienti e 19 volte più probabilità di essere redditizie. Tuttavia, nonostante la crescente domanda di processo-decisionale basato sui dati, molte organizzazioni continuano a incontrare ostacoli quali silos di dati, vendor lock-in e rischi di conformità dovuti a framework di governance dei dati insufficienti.

Per affrontare queste sfide, alcune organizzazioni hanno adottato un approccio data-as-a-product, trattando i dati come un asset gestito e consumabile piuttosto che un sottoprodotto delle operazioni.  

Le metodologie data-as-a-product enfatizzano la strutturazione e la gestione dei dati per informare le decisioni aziendali e migliorare l'esperienza degli utenti. Partendo da quella base, i prodotti di dati forniscono un approccio strutturato e self-service alla gestione dei dati, riducendo la dipendenza dai team tecnici e supportando il processo decisionale in tempo reale. 

Le organizzazioni che investono in prodotti di dati possono ottenere miglioramenti a livello di accesso ai dati, interoperabilità,data storage e governance dei dati. In tutti i settori, i prodotti di dati hanno il potenziale per migliorare l'automazione, supportare il processo decisionale basato sui dati e aiutare le aziende ad allineare le proprie strategie di dati agli obiettivi aziendali a lungo termine. Utilizzando piattaforme dati affidabili, modelli di machine learning e strumenti di visualizzazione , le organizzazioni possono consentire ai team di utilizzare al meglio i propri dati. 

I prodotti di dati spesso ottengono questi vantaggi conferendo poteri a vari ruoli all'interno di un'organizzazione: 

  • Data scientist e AI engineer ottengono un accesso più rapido ai dati e agli elementi pertinenti, accelerando lo sviluppo e l'implementazione di soluzioni di AI e ML. 
  • I data engineer traggono beneficio dai test, dall'implementazione e dalla data curation, garantendo che le pipeline soddisfino gli standard di qualità dei dati e gli accordi sui livelli di servizio specificati nei contratti dei prodotti di dati. 
  • I data analyst e i consumatori ricevono dati tempestivi e affidabili che si allineano alle loro esigenze specifiche e che possono essere aggiornati rapidamente senza dipendere da un team IT centrale. 
  • I data steward possono mantenere una solida governance e conformità attraverso contratti sui dati, stabilendo barriere chiare che proteggono i dati e li mantengono al sicuro. 

Data-as-an-asset e data-as-a-product a confronto 

Il modo in cui le organizzazioni gestiscono i dati si è evoluto da un approccio passivo basato sugli asset a una strategia attiva e basata sui prodotti.

Data-as-an-asset (approccio tradizionale)

Tradizionalmente, le aziende hanno sempre trattato i dati come qualcosa da raccogliere e memorizzare. Questo approccio mette i dati in un data warehouse o in un source system centrale, organizzandoli per area tematica (come finanza o marketing) e assegnando la proprietà a team centralizzati. Il successo si misura spesso in base al volume di dati, ad esempio i terabyte memorizzati, con la speranza che, semplicemente disponendo di più dati, i dipendenti li utilizzino. 

Tuttavia, i metadati sono in genere definiti dai reparti IT e non sono di facile utilizzo per i consumatori di dati. Di conseguenza, molti attività che coinvolgono asset di dati ruotano attorno ad analytics descrittive e reporting, guardando indietro a ciò che è accaduto anziché utilizzare i dati in modo proattivo per risolvere le problematiche aziendali. 

Data-as-a-product (nuovo approccio)

Al contrario, considerando i dati come un prodotto si sposta l'attenzione dallo storage all'utilizzo e alla creazione di valore. I prodotti di dati attraversano uno specifico ciclo di vita e sono progettati, testati e iterati proprio come i prodotti software che seguono una metodologia agile o DataOps.  

La proprietà è specifica del dominio (ad esempio, un prodotto di dati di marketing gestito da esperti di marketing), che mantiene i dati pertinenti e di alta qualità. I dati sono inoltre curati per esigenze di consumo specifiche, con metadati ricchi basati sull'azienda. Ciò garantisce che i prodotti di dati siano facilmente individuabili e comprensibili dagli utenti aziendali.

Poiché i proprietari dei dati si assumono la responsabilità dei prodotti di dati, viene effettuato un monitoraggio continuo dell'utilizzo, della qualità e del valore derivati da un prodotto tramite feedback con gli utenti finali.  

Il successo si misura in base a come i dati migliorano il processo decisionale, generano fatturato o riducono i costi, piuttosto che semplicemente in base a quanti terabyte vengono memorizzati. Di conseguenza, le iniziative relative ai prodotti di dati possono risolvere le domande aziendali con analytics avanzate, come la modellazione predittiva e prescrittiva. 

  

Componenti di un prodotto di dati

Un prodotto di dati ben strutturato è costituito da diversi componenti che consentono funzionalità e usabilità all'interno dell'ecosistema di dati di un'organizzazione: 

  • Modelli e schemi di dati: strutture definite che standardizzano l'organizzazione dei dati, migliorando l'accessibilità e la coerenza semantica. Spesso si basano su SQL per le query e le trasformazioni. 
  • Interfacce e API: meccanismi che facilitano l'integrazione con applicazioni e app aziendali, garantendo un accesso ai dati semplice e sicuro. 
  • Visualizzazioni e dashboard: strumenti intuitivi che presentano gli insight attraverso report interattivi o display analitici, facilitando l'interpretazione dei dati. 
  • Modelli ML: algoritmi predittivi che analizzano i modelli all'interno dei dati, supportando un processo decisionale informato attraverso l'elaborazione avanzata. 
  • Controlli di sicurezza e governance: politiche e misure che garantiscono la conformità alle normative sulla governance dei dati, tracciano la derivazione dei dati e gestiscono i controlli degli accessi per mantenere la sicurezza e l'integrità dei dati

 

    Tipi di prodotti di dati

    I prodotti di dati possono essere categorizzati in base alla qualità dei dati e ai livelli di perfezionamento. I tipi di prodotti di dati includono: 

    Basato sulla fonte

    Prodotti di dati dai sistemi di origine. Questo tipo di prodotto di dati grezzi (o con trasformazione minima) rappresenta spesso l'elemento fondamentale per casi d'uso quali data science e AI generativa.

    Basato su master

    Prodotti di dati che sono stati curati e consolidati in dati master che standardizzano le principali entità aziendali (come clienti o prodotti) per garantire la coerenza tra i sistemi. 

    Basato su insight

    Prodotti di dati raffinati, elaborati e progettati per supportare il processo decisionale e generare insight fruibili. 

    Ciclo di vita del prodotto di dati

    Seguendo un ciclo di vita strutturato di gestione dei prodotti, i team di dati possono creare prodotti di dati che abbiano un valore continuo e siano scalabili e in linea con le esigenze aziendali in evoluzione. 

    ​Le fasi chiave del ciclo di vita di un prodotto di dati includono: 

    1. Definizione: definire l'obiettivo aziendale, il caso d'uso, le specifiche di progettazione e il contratto dei dati. Include attributi come termini, condizioni e accordi di servizio a livello di servizio

    2. Sviluppo: crea i componenti del prodotto di dati, come tabelle, viste, modelli, file e dashboard. Quindi, esegui il test in base al contratto dei dati. 

    3. Confezionamento: cura i componenti del prodotto di dati in un pacchetto riutilizzabile, arricchito con metadati aziendali e tecnici per una facile individuazione all'interno di un catalogo di dati o di un altro strumento di data storage.

    4. Governance: gestisce i permessi di accesso del prodotto di dati in base al contratto dei dati. 

    5. Pubblicazione: pubblica il prodotto di dati su un portale affinché sia reperibile.  

    6. Consumo: consenti ai consumatori di tutta l'organizzazione di accedere facilmente al prodotto di dati per affrontare varie problematiche. Raccogli il feedback dei consumatori per apportare miglioramenti alle versioni future.​ 

    7. Monitora e ripeti: conduci attività continue come il monitoraggio degli utilizzi, della qualità e degli accessi. Implementa la gestione delle versioni per le modifiche alla versione dei prodotti di dati pubblicati.​​ 

    8. Ritiro: ritira il prodotto di dati per motivi quali la mancanza di utilizzo o la non conformità. Rendi obsoleto il prodotto, informa i consumatori, archivia i prodotti e ripulisci le risorse. 

    Casi d'uso dei prodotti di dati

    Le organizzazioni di tutti i settori si affidano ai prodotti di dati per generare valore aziendale, supportare le iniziative strategiche e risolvere problemi aziendali critici.  

    Esempi reali di prodotti di dati includono:

    • Una grande banca nazionale ha implementato un unico prodotto di dati riguardanti i clienti che supporta 60 casi d'uso diversi, che vanno dalla valutazione del rischio di credito in tempo reale ai chatbot AI,su più canali. La banca ha quindi guadagnato ulteriori 60 milioni di dollari di fatturato annuo e ha evitato 40 milioni di dollari di perdite. 

    • Un'azienda di beni di consumo confezionati (CPG) ha introdotto prodotti di dati per semplificare l'utilizzo dei dati, migliorando l'efficienza e la scalabilità. Impiegando oltre 50 team interfunzionali per implementare soluzioni basate sui dati, l'azienda ha aumentato del 18% l'EBITDA in due anni.

    Costruire e scalare prodotti di dati

    Per sviluppare con successo prodotti di dati è necessario un approccio strategico che includa la comprensione del consumo dei dati, la mappatura delle interazioni dei dati, la verifica del valore di mercato e l'iterazione per la scalabilità. 

    Analizzare i pattern del consumo di dati 

    Il primo passo per creare un prodotto di dati è l'analisi del consumo dei dati all'interno dell'organizzazione. Questo passaggio prevede l'identificazione degli utenti target, la comprensione dei dati che consumano e il motivo per cui tali dati sono importanti per loro.  

    La revisione dell'utilizzo dei dati in termini di volume, frequenza, sensibilità e tipo fornisce insight su quali set di dati hanno il maggior valore. Dando priorità ai gruppi di utenti ad alto impatto, le organizzazioni possono contribuire a garantire che gli sforzi iniziali si concentrino sulle aree con il maggiore potenziale di impatto sul business. 

    Mappatura del percorso dei dati 

    Una volta che i modelli di consumo dei dati sono chiari, il passo successivo è la mappatura del percorso dei dati. La creazione di mappe dettagliate delle interazioni con i dati del mondo reale aiuta a visualizzare il flusso dei dati tra diversi sistemi e team.  

    Queste mappe possono fungere da base per il brainstorming di nuovi casi d'uso che generano entrate per i prodotti di dati. Sviluppare ipotesi su come i prodotti di dati possono migliorare i processi aziendali può aiutare le organizzazioni a iniziare a esplorare modi per trasformare i dati non elaborati in insight significativi e fruibili. 

    Iterazione e scalabilità 

    Una volta convalidati gli insight, il passo successivo consiste nel ripetere e ampliare. Invece di affidarsi esclusivamente ai team IT centrali, le organizzazioni possono promuovere l'agilità e l'innovazione dando la possibilità ai settori e ai team aziendali di perfezionare e migliorare il prodotto di dati. Una volta apportati i miglioramenti, il progetto può essere esteso a più team e domini, assicurando che il prodotto di dati sia scalabile in modo efficace e continui a generare valore aziendale. 

    Soluzioni correlate
    IBM Data Product Hub

    Gestisci i dati come un prodotto durante il loro intero ciclo di vita. Gestisci il ciclo di vita dei prodotti di dati, dall'integrazione alla dismissione, con un solido sistema per il controllo delle versioni, la manutenzione e l'aggiornamento dei prodotti di dati.

    Esplora Data Product Hub
    Soluzioni IBM Data Intelligence

    Trasforma rapidamente i dati non elaborati in insight fruibili, unifica governance, qualità, lineage e condivisione dei dati e offri agli utenti dati affidabili e contestualizzati.

    Esplora le soluzioni di data intelligence
    Servizi di consulenza per dati e analytics

    Sblocca il valore dei dati aziendali con IBM Consulting e crea un'organizzazione basata su insight in grado di generare vantaggi aziendali.

    Esplora i servizi di analytics
    Fai il passo successivo

    Per prosperare, le aziende devono utilizzare i dati per fidelizzare i clienti, automatizzare i processi aziendali e innovare con soluzioni basate sull'AI.

    Esplora le soluzioni di analytics Scopri Data Product Hub