Le blockchain e i big data sono tra le principali tecnologie emergenti che si prevede rivoluzioneranno diversi settori, cambiando radicalmente il modo in cui vengono gestite aziende e organizzazioni. Si potrebbe supporre che queste tecnologie siano mutuamente esclusive, ognuna crea percorsi unici e si applica indipendentemente l'una dall'altra.
Ma questo sarebbe un errore.
La blockchain, proprio come la data science, sta gradualmente trasformando il modo in cui operano diversi settori. E mentre la data science si concentra sull'utilizzo dei dati per una corretta gestione, la blockchain garantisce fiducia nei dati mantenendo un registro decentralizzato.
La domanda è: esiste un punto in cui questi due concetti si intersecano?
Cosa si ottiene quando queste due tecnologie vengono applicate contemporaneamente?
In parole povere, come può la blockchain rivoluzionare la data science?
Per rispondere a queste domande, è utile comprendere meglio blockchain e data science separatamente.
La blockchain è fondamentalmente un registro di fiducia che registra le transazioni economiche in modo che non possano essere manipolate. La tecnologia è emersa come risultato dell'interesse per i bitcoin e le criptovalute in generale, ma da allora ha trovato importanza nella registrazione non solo delle transazioni di criptovalute, ma di qualsiasi cosa di valore. Date le funzionalità di questa tecnologia emergente, gli sviluppatori e gli appassionati di tecnologia si sono messi al lavoro per creare un caso d'uso dopo l'altro per la blockchain.
Negli ultimi anni la domanda per gli sviluppatori di blockchain è aumentata esponenzialmente, parallelamente a progetti su diverse applicazioni della blockchain. Secondo i report di piattaforme freelance come UpWork, le competenze in ambito blockchain sono quelle più richieste. Allo stesso modo, si dice che i professionisti di altri settori, come gli studi legali, abbiano un vantaggio notevole se possiedono competenze in materia di blockchain, o almeno se conoscono la tecnologia.
Newsletter di settore
Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e altro con la newsletter Think. Leggi l'Informativa sulla privacy IBM.
L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.
La data science cerca di estrarre conoscenze e insight da dati strutturati e non strutturati. Questo campo comprende statistica, analisi dei dati, machine learning e altri metodi avanzati utilizzati per comprendere e analizzare i processi reali utilizzando i dati.
Nel linguaggio economico, i dati vengono spesso descritti come il nuovo petrolio, motivo per cui le aziende leader, tra cui i famosi GAFA (Google, Amazon, Facebook e Apple), hanno il controllo di enormi quantità di dati. Alcune applicazioni comuni di data science si riscontrano nei protocolli dei motori Internet, nelle pubblicità digitali e nei servizi di raccomandazione. L'analisi dei dati, un aspetto chiave della data science, si è rivelata rilevante nel settore sanitario per il monitoraggio del trattamento dei pazienti e il flusso dell'attrezzatura; nei viaggi e giochi per migliorare l'esperienza del consumatore; per la gestione dell'energia così come per molti altri settori.
C'è anche una domanda apparentemente insaziabile di data scientist che possono fornire maggiori insight con i dati e aiutare a risolvere più problemi. Questo è ancora più evidente parlando dei big data, un aspetto avanzato della data science che si occupa di quantità estremamente grandi di dati che non possono essere gestiti con metodi di elaborazione dei dati tradizionali.
A differenza di settori come Fintech, sanità e supply chain, dove la blockchain è ormai molto diffusa, la tecnologia non è stata esplorata in modo approfondito negli aspetti della data science. Per alcuni, la relazione tra i concetti è poco chiara, se non inesistente.
Innanzitutto, sia blockchain che data science hanno a che fare con i dati: la data science analizza i dati per ottenere insight attuabile, mentre la blockchain registra e convalida i dati. Entrambe si avvalgono di algoritmi creati per governare le interazioni con vari segmenti di dati. Un tema comune che presto noterete è questo: "la data science per la previsione; la blockchain per l'integrità dei dati".
La data science, come ogni progresso tecnologico, ha le sue sfide e limitazioni che, se affrontate, ne scateneranno tutte le funzionalità. Tra le principali sfide della data science rientrano dati inaccessibili, problemi di privacy dei dati e dati contaminati.
Il controllo dei dati contaminati (o informazioni errate) è uno degli ambiti in cui la tecnologia blockchain può avere un impatto positivo nel campo della data science. Secondo un sondaggio del 2017 su 16.000 professionisti dei dati, l'inclusione di dati contaminati come dati duplicati o errati è stata identificata come la sfida più grande per la data science. Attraverso l'algoritmo di consenso decentralizzato e la crittografia, la blockchain convalida i dati rendendoli quasi impossibili da manipolare a causa dell'enorme quantità di potenza richiesta.
Ancora una volta, grazie al suo sistema decentralizzato, la tecnologia blockchain garantisce la sicurezza e la privacy dei dati. La maggior parte dei dati è memorizzata in server centralizzati che spesso sono bersaglio di attacchi informatici; le numerose segnalazioni di hacking e violazioni di sicurezza dimostrano l'entità della minaccia. La blockchain, invece, restituisce il controllo dei dati agli individui che li generano, rendendo difficile per i criminali informatici accedere e manipolare i dati su larga scala.
Se grande è la quantità, la blockchain migliora la qualità, afferma Maria Weinberger di Janexter. Questo segue la comprensione che la blockchain si concentra sulla convalida dei dati, mentre la data science o i big data implicano l'elaborazione di previsioni da grandi quantità di dati.
La blockchain ha portato un modo completamente nuovo di gestire e operare con i dati, non più in una prospettiva centrale in cui tutti i dati dovrebbero essere raccolti, ma in modo decentralizzato in cui i dati possono essere analizzati direttamente dall'edge dei singoli dispositivi. La blockchain si integra con altre tecnologie avanzate, come soluzioni cloud, intelligenza artificiale (AI) e Internet of Things (IoT).
Inoltre, i dati validati generati tramite la tecnologia blockchain sono strutturati e completi, oltre al fatto che sono immutabili, come abbiamo già detto. Un altro ambito importante in cui i dati generati da blockchain diventano un vantaggio per i big data è l'integrità dei dati, poiché la blockchain accerta l'origine dei dati attraverso le sue catene collegate.
Esistono almeno cinque modi specifici in cui i dati della blockchain possono aiutare i data scientist in generale.
I dati registrati sulla blockchain sono affidabili perché devono aver attraversato un processo di verifica che ne garantisce la qualità. Inoltre, garantisce la trasparenza, poiché le attività e le transazioni che avvengono sulla rete blockchain possono essere tracciate.
L'anno scorso, Lenovo ha presentato questo caso d'uso della tecnologia blockchain per rilevare documenti e moduli fraudolenti. I giganti del PC utilizzavano la tecnologia blockchain per convalidare documenti fisici codificati con firme digitali. Le firme digitali vengono elaborate dai computer e l'autenticità del documento viene verificata tramite un record blockchain.
Nella maggior parte dei casi, l'integrità dei dati è garantita quando i dettagli dell'origine e delle interazioni riguardanti un blocco dati vengono memorizzati sulla blockchain e automaticamente verificati (o convalidati) prima che si possa fare altro.
Poiché la blockchain utilizza un algoritmo di consenso per verificare le transazioni, è impossibile che una singola unità rappresenti una minaccia per la rete dati. Un nodo (o unità) che inizia ad agire in modo anomalo può essere facilmente identificato ed espulso dalla rete.
Poiché la rete è così distribuita, è quasi impossibile che una singola parte generi una potenza computazionale sufficiente per alterare i criteri di validazione e consentire l'ingresso di dati indesiderati nel sistema. Per modificare le regole della blockchain, la maggior parte dei nodi deve essere messa insieme per creare un consenso. Questo non sarà possibile per un singolo attore malintenzionato.
I dati della blockchain, come altri tipi di dati, possono essere analizzati per rivelare preziosi insight sui comportamenti, sulle tendenze e quindi possono essere utilizzati per prevedere risultati futuri. Inoltre, la blockchain fornisce dati strutturati raccolti da individui o da dispositivi individuali.
Nell'analisi predittiva, i data scientist si basano su ampi set di dati per determinare con accuratezza l'esito di eventi sociali come le preferenze dei clienti, il valore di vita del cliente, i prezzi dinamici e i tassi di abbandono in relazione alle aziende. Tuttavia, questo non si limita agli insight aziendali, poiché quasi ogni evento può essere previsto con la giusta analisi dei dati, che si tratti di sentimenti social o di indicatori di investimento.
E grazie alla natura distribuita della Blockchain e all'enorme potenza di calcolo disponibile attraverso di essa, i data scientist anche nelle piccole organizzazioni possono svolgere ampie attività di analisi predittiva. Questi data scientist possono utilizzare la potenza di calcolo di diverse migliaia di computer collegati a una blockchain come servizio cloud per analizzare i risultati sociali su una scala, un risultato altrimenti impossibile.
Come è stato dimostrato nei sistemi finanziari e di pagamento, la blockchain consente transazioni transfrontaliere in tempo reale. Diverse banche e innovatori del settore fintech stanno ora esplorando la blockchain perché consente di effettuare pagamenti rapidi, addirittura in tempo reale, di ingenti somme di denaro, indipendentemente dalle barriere geografiche.
Allo stesso modo, le organizzazioni che necessitano di un'analisi in tempo reale dei dati su larga scala possono ricorrere a un sistema abilitato alla blockchain. Con la blockchain, banche e altre organizzazioni possono osservare i cambiamenti nei dati in tempo reale, rendendo possibile prendere decisioni rapide, che si tratti di bloccare una transazione sospetta o di tracciare attività anomale.
A tal proposito, i dati ottenuti dagli studi di dati possono essere memorizzati in una rete blockchain. In questo modo, i team di progetto non ripetono analisi dei dati già effettuate da altri team né riutilizzano erroneamente dati già utilizzati. Inoltre, una piattaforma blockchain può aiutare i data scientist a monetizzare il proprio lavoro, probabilmente scambiando risultati di analisi memorizzati sulla piattaforma.
La blockchain, come è stato notato, è ancora nelle sue fasi iniziali, anche se potrebbe non sembrarlo a causa dell'entusiasmo pubblico che la tecnologia ha suscitato in poco tempo. Ci si aspetterebbe che, con la maturazione della tecnologia e l'arrivo di nuove innovazioni, vengano identificati e esplorati casi d'uso più concreti, con la data science come area che ne trarrà più beneficio.
Detto questo, sono state sollevate alcune questioni circa il suo impatto sulla data science, in particolare sui big data, che richiedono la gestione di quantità di dati eccezionalmente grandi. Una preoccupazione è che l'applicazione della blockchain in questo senso sarà molto costosa. Questo perché la memorizzazione dei dati su una blockchain è costosa rispetto ai metodi tradizionali. I blocchi trattano quantità relativamente piccole di dati rispetto ai grandi volumi di dati raccolti al secondo per i big data e altre attività di analisi dei dati.
Come la blockchain si evolverà per affrontare queste preoccupazioni e proseguirà a rivoluzionare il campo della data science sarà particolarmente interessante perché, come abbiamo visto, la tecnologia ha un enorme potenziale per trasformare il modo in cui gestiamo e utilizziamo i dati.
Di tanto in tanto, invitiamo leader di pensiero del settore, esperti accademici e partner a condividere le loro opinioni e insight sulle tendenze attuali della blockchain sul blog Blockchain Pulse. Sebbene le opinioni contenute in questi post sul blog siano personali e non riflettano necessariamente le opinioni di IBM, questo blog si impegna ad accogliere tutti i punti di vista nella conversazione.
IBM Blockchain Platform: Hyperledger Fabric Support Edition fornisce SLA e supporto aziendale 24 ore su 24, 7 giorni su 7, per Hyperledger Fabric, lo standard de facto per le piattaforme blockchain aziendali della Linux Foundation.
IBM Blockchain aiuta i partner della supply chain a condividere dati affidabili attraverso soluzioni blockchain autorizzate, aumentando trasparenza e fiducia.
IBM Consulting è una società di consulenza globale che lavora fianco a fianco con i clienti per progettare, costruire e gestire aziende ad alte prestazioni.