My IBM Accedi Iscriviti

Home

Think

Argomenti

Condivisione dati

Che cosa si intende per condivisione dei dati?

Che cosa si intende per condivisione dei dati?

Esplora il Data Product Hub di IBM Abbonati per ricevere gli aggiornamenti sull'AI
Illustrazione che illustra il flusso di dati verso le nuvole

Data di pubblicazione: 30 agosto 2024
Autore: Tim Mucci

Che cosa si intende per condivisione dei dati?

Che cosa si intende per condivisione dei dati?

La condivisione dei dati è il processo che consente di rendere disponibili le risorse di dati di un'organizzazione a più applicazioni, utenti e altre organizzazioni. Una condivisione efficace dei dati implica una combinazione di tecnologie, pratiche, framework giuridici e sforzi organizzativi per facilitare l'accesso sicuro a più entità senza compromettere l'integrità dei dati.

Le organizzazioni che adottano l'analytics dei big data riconoscono i dati come un prezioso asset strategico nel loro portafoglio. Questi dati provengono da varie fonti, come metriche derivate da applicazioni software, dati sul comportamento dei clienti e segnali dell'Internet of Things (IoT) provenienti da elettrodomestici e sensori.

Pensa ai dati come ai libri in una biblioteca. La condivisione dei dati è come avere una tessera della biblioteca che consente a tutti i membri dell'organizzazione di accedere e prendere in prestito i libri quando ne hanno bisogno. Senza la condivisione dei dati, ogni dipartimento dovrebbe creare e mantenere la propria libreria, con conseguenti duplicazioni, informazioni obsolete e risorse limitate.

Le organizzazioni che condividono i dati possono collaborare in modo più efficace con i partner, stabilire nuove opportunità di business, formare nuove partnership e generare flussi di entrate attraverso prodotti di dati e altre monetizzazioni. Tuttavia, la condivisione dei dati richiede l'impegno a mantenere l'integrità e l'affidabilità dei dati condivisi durante tutto il ciclo di vita, garantendo che rimangano affidabili, coerenti e utili per un'analisi accurata. Una condivisione efficace dei dati consente agli stakeholder di acquisire prospettive preziose, sviluppare nuovi servizi e tecnologie e prepararsi per le tendenze imminenti analizzando grandi quantità di dati, sia all'interno che all'esterno dell'organizzazione.

Esplora la guida per i leader dei dati di IBM

La guida per i leader dei dati illustra come ogni tipo di database soddisfi le esigenze di un’azienda, a seconda che l’organizzazione assegni priorità all’analytics, all’AI o alle prestazioni delle applicazioni.

Contenuti correlati Scopri in che modo un piano di gestione dei dati contribuisce a proteggere le informazioni sensibili I dati come prodotto offrono un approccio strutturato alla gestione del valore dei dati
Il valore della condivisione dei dati per un'organizzazione

Il valore della condivisione dei dati per un'organizzazione

Le organizzazioni condividono i dati da molto prima dell'invenzione di Internet, ma i progressi nell'alfabetizzazione digitale, nella tecnologia e nell'adozione del cloud hanno portato alla condivisione in tempo reale su scala globale. Le tecnologie di storage e trasferimento dei dati sono più disponibili e convenienti che mai. Di conseguenza, si sono evolute politiche e normative volte a ridurre i rischi associati alla condivisione dei dati, che quindi non si limita a consentire l'accesso per l'analisi e la monetizzazione, ma abbatte le barriere tra le unità di business e i partner esterni. Diversi team possono lavorare in modo indipendente o insieme, ciascuno attingendo alla stessa fonte di dati aggiornata. L'aumento della quantità e della varietà di dati disponibili consente ai team diversificati in tutta l'organizzazione di contribuire a obiettivi organizzativi più ampi.

La combinazione di informazioni provenienti da varie fonti, come dati di ricerca, dati operativi o feedback dei clienti, migliora le prestazioni del servizio e aumenta il valore di tali servizi. Ad esempio, le unità di business con accesso ai dati possono utilizzarne l'analisi per decidere in base alle tendenze del mercato e alle preferenze dei clienti e sviluppare strategie di marketing di successo.

Inoltre, la condivisione dei dati consente alle autorità pubbliche e alle organizzazioni di condividere i dati in modo sicuro, lecito e disciplinato. Una parte essenziale dell'igiene della condivisione dei dati prevede che i produttori di dati documentino ed etichettino attentamente i set di dati con metadati accurati per supportare la riproducibilità. Descrizioni dettagliate con definizioni chiare assicurano che gli altri possano trovare, scoprire e comprendere facilmente i dati condivisi.

Il Future of Privacy Forum1 (FPF) ha analizzato le partnership per la condivisione dei dati tra aziende e ricercatori accademici e ha stabilito che queste partnership possono accelerare la ricerca socialmente vantaggiosa, ampliare l'accesso a set di dati preziosi e migliorare la riproducibilità dei risultati della ricerca. Man mano che la condivisione dei dati diventa più diffusa, gli stakeholder adottano misure proattive per affrontare i rischi e le violazioni dei dati utilizzando accordi di condivisione dei dati (DSA) e tecnologie per il miglioramento della privacy (PET).

IBM fornisce un buon esempio dell'utilizzo di rigorosi protocolli di privacy e sicurezza nelle sue pratiche di condivisione dei dati, incluso l'uso dei PET per rendere anonimi i dati prima di condividerli con università, organizzazioni no profit e laboratori di ricerca. L'approccio di IBM supporta la scoperta scientifica proteggendo al contempo i dati sensibili e promuovendo partnership più sicure ed efficaci. Ad esempio, IBM ha collaborato con Melbourne Water in Australia per analizzare i dati volti a ridurre le emissioni energetiche. Durante la pandemia di COVID-19, IBM ha elaborato sequenze genomiche del SARS-CoV-2, contribuendo con oltre 3 milioni di sequenze a un archivio di ricerca.

Un altro caso d'uso convincente del valore della condivisione dei dati proviene dall'organizzazione no profit statunitense Benefits Data Trust.2 Benefits Data Trust (BDT) promuove la condivisione dei dati tra gli stati e le organizzazioni coinvolte nella sanità e nell'istruzione degli Stati Uniti. Attraverso accordi di condivisione dei dati, BDT aumenta l'iscrizione a programmi pubblici fondamentali come il Supplemental Nutrition Assistance Program (SNAP) e Medicaid.

Il Dipartimento dei Servizi Sociali della Carolina del Sud, insieme a BDT, ha confrontato gli elenchi mensili di Medicaid e SNAP, in cui ha identificato le persone idonee non iscritte al programma. Questa iniziativa ha portato a oltre 20.000 iscrizioni SNAP in più dal 2015, migliorando l'accesso all'assistenza nutrizionale per le popolazioni vulnerabili. Anche in Pennsylvania iniziative simili hanno avuto successo: la condivisione dei dati ha contribuito a far iscrivere circa 240.000 persone a vari programmi di assistenza pubblica dal 2005.

I rischi inerenti alla condivisione dei dati

I rischi inerenti alla condivisione dei dati

Sebbene la condivisione dei dati offra alle aziende numerosi benefici, non è esente da rischi. Quando le informazioni sensibili vengono distribuite in modo improprio, possono esporre un'organizzazione a rischi normativi, competitivi, finanziari e di sicurezza. I consumatori di dati hanno un controllo limitato sulla qualità e la disponibilità dei dati stessi. I dati di bassa qualità potrebbero anche nascondere pregiudizi rispetto a generi, razze, religioni o gruppi etnici.

I processi di governance dei dati stabiliscono le politiche, gli standard e le best practice per gestire i dati in modo sicuro, accurato e coerente in tutta l'organizzazione. Una governance efficace limita l'accesso in modo che solo gli utenti autorizzati dispongano delle autorizzazioni per l'utilizzo dei dati. La governance protegge, classifica e aiuta a garantire che i dati siano utilizzati in conformità con gli enti legali e normativi.

Ogni organizzazione ha obblighi legali ed etici per salvaguardare la privacy dei dati dei clienti che gestisce. Tecnologie come la crittografia e l'oscuramento dei dati ne consentono una condivisione sicura proteggendo la privacy. Tuttavia, la mancanza di comunicazione tra i produttori di dati e i consumatori può portare a interpretazioni errate, con conseguenti ipotesi errate durante lo sviluppo di report o l'adozione di iniziative decisionali basate sui dati.

Ad esempio, nel 2012, Knight Capital Group3 ha riscontrato un problema commerciale a causa della mancanza di comunicazione e coordinamento tra i team, che ha causato la perdita di 440 milioni di dollari in soli 45 minuti. Un aggiornamento software ha attivato inavvertitamente un software embedded non testato, non documentato e inattivo. Poiché gli sviluppatori non hanno comunicato in modo efficace i potenziali impatti delle modifiche ai sistemi dei commercianti, le operazioni errate sono state eseguite ad alta velocità, con conseguenti perdite finanziarie significative.

Il costoso trasferimento dei dati, in particolare attraverso processi di estrazione, trasformazione, caricamento (ETL) ad alta intensità di risorse, ha tradizionalmente ostacolato la condivisione diffusa dei dati. Mantenere le best practice di governance e qualità dei dati può essere una sfida, soprattutto quando si ha a che fare con enormi volumi. La condivisione sicura di set di dati di grandi dimensioni in rete richiede molto tempo, è altamente tecnica e richiede un notevole investimento in storage e infrastruttura.

La sicurezza dei dati richiede misure di protezione rigorose e formazione per salvaguardare i dati sensibili. Le informazioni che viaggiano attraverso reti e piattaforme durante i processi di condivisione dei dati sono vulnerabili alle minacce, come accessi non autorizzati, violazioni dei dati e attacchi informatici. Inoltre, le organizzazioni devono attenersi a leggi e regolamenti complessi sulla privacy dei dati quando li condividono con partner esterni, stakeholder o fornitori terzi.

Best practice per la condivisione dei dati

Best practice per la condivisione dei dati

L'implementazione delle best practice nella condivisione dei dati aiuta le organizzazioni a massimizzare i benefici riducendo al minimo i rischi.

  • Le valutazioni regolari possono aiutare a valutare l'efficacia dei dati, i processi di trasferimento dei dati e la cultura organizzativa sulla condivisione dei dati, oltre ad agire per rispondere alle relative preoccupazioni.
  • Le soluzioni open source per la condivisione dei dati aiutano le organizzazioni a evitare il blocco da fornitore e ad aprire una serie di integrazioni sviluppate dalla community con i framework di trattamento dei dati open source e gli strumenti di business intelligence più diffusi, riducendo i costi della tecnologia e dell'infrastruttura.
  • Politiche di governance chiare e protocolli di condivisione dei dati ben definiti portano a una gestione dei dati responsabile. Senza di essa, i team potrebbero costruire a partire da dati errati e la leadership potrebbe prendere decisioni basate su dati distorti, mettendo a rischio l'organizzazione.

Un marketplace di dati consente alle organizzazioni di condividere e monetizzare in modo sicuro i propri dati e i prodotti basati sui dati. Esistono diversi tipi di marketplace di dati:

  • Un marketplace interno dei dati serve a condividerli all'interno di un'azienda
  • Un marketplace privato di dati serve a condividerli con dei partner fidati
  • Un marketplace pubblico dei dati serve a mettere in contatto fornitori di dati e consumatori

I marketplace pubblici dei dati offrono ai partecipanti un ambiente sicuro per l'acquisto e la vendita di dati e servizi correlati, certificando l'alta qualità e la coerenza dei fornitori di dati. Le aziende possono utilizzare un marketplace di dati per acquisire dati di terze parti e arricchire i set di dati esistenti o per offrire e monetizzare nuovi prodotti e servizi di dati.

Tipi e tecnologie di condivisione dei dati

Tipi e tecnologie di condivisione dei dati

Ogni tipo di condivisione dei dati svolge un ruolo specifico nel facilitare uno scambio sicuro di informazioni.

  • La condivisione interna dei dati si concentra sull'abbattimento dei silos di dati all'interno dell'organizzazione per garantire che tutte le parti abbiano accesso ai dati necessari in un ambiente sicuro.
  • La condivisione di dati esterni coinvolge partner, clienti, fornitori e organismi di regolamentazione. Poiché sono esterni, i dati sono soggetti a misure di sicurezza più rigorose per proteggere le informazioni sensibili.
  • Tra i tipi di dati interni ed esterni, ci sono anche dati pubblici e privati. I dati pubblici sono accessibili a chiunque, mentre i dati privati sono riservati a determinati individui o gruppi.

I tipi di tecnologia di condivisione dei dati più utilizzati tra le organizzazioni aziendali sono il data warehouse e il data lakehouse. Questi moderni sistemi di architettura dei dati forniscono dei repository centrali per la raccolta, la memorizzazione e la condivisione di big data da più unità di business. Queste architetture includono in genere livelli per client front-end, Analytics Engine e server di database.

Un'interfaccia di programmazione delle applicazioni (API) consente ai componenti software di comunicare definizioni e protocolli condivisi. Le API di condivisione dei dati supportano controlli di accesso e autorizzazioni granulari, specificando quali dati i consumatori possono e non possono richiedere.

L'apprendimento federato, la tecnologia blockchain e le piattaforme di scambio di dati sono altre tecnologie che supportano la condivisione dei dati. L'apprendimento federato consente ai sistemi di AI di addestrarsi su set di dati distribuiti provenienti da diverse fonti senza dover spostare i dati. La blockchain fornisce un registro trasparente e immutabile per il monitoraggio delle transazioni, comprese quelle su scambi di open data, fornendo un livello di integrità e sicurezza ai processi di condivisione dei dati.

Le tecnologie legacy come il Secure File Transfer Protocol (SFTP) e l'e-mail consentono soluzioni personalizzate e indipendenti dal fornitore, ma sono sempre più difficili da proteggere e gestire. Mancano di funzionalità di sicurezza avanzate come la crittografia a riposo, i controlli granulari dell'accesso ai dati e l'audit automatico, più comuni nelle soluzioni moderne.

Le moderne soluzioni di dati si concentrano sulla condivisione sicura dei dati, con il data storage nel cloud che offre scalabilità e affidabilità con limitazioni all'accessibilità e alla sicurezza. Le soluzioni di condivisione dei dati specifiche del fornitore offrono sicurezza e scalabilità integrate, ma spesso presentano il blocco da fornitore, che limita la flessibilità e aumenta i costi a lungo termine.

Tendenze future nella condivisione dei dati

Tendenze future nella condivisione dei dati

Le tecnologie che migliorano la privacy, le camere bianche dei dati e altre tecnologie stanno migliorando le operazioni sui dati attraverso l'automazione. Queste tendenze evidenziano il passaggio alla privacy, al decentramento e agli approcci basati sull'AI nella gestione e nell'analisi dei dati.

PET

Le tendenze future nella condivisione dei dati sottolineano la crescente importanza della privacy. Le tecnologie che migliorano la privacy come il calcolo sicuro multipartitico e il mascheramento dei dati stanno diventando fondamentali per bilanciare la condivisione perfetta dei dati e la protezione sicura dei dati. L'adozione delle PET offre alle aziende un vantaggio competitivo in quanto questi strumenti diventano parte integrante delle operazioni.

Camere bianche

Le camere bianche dei dati sono ambienti sicuri e incentrati sulla privacy in cui più parti possono collaborare sui dati senza condividere dati non elaborati. Consentono alle aziende di eseguire analytics e ottenere insight, proteggendo al contempo i dati sensibili in modo che rimangano conformi alle normative sulla privacy. Le camere bianche aiutano a mantenere la fiducia tra i partner impedendo l'esposizione di informazioni personali e consentendo la condivisione di dati aggregati e anonimizzati.

Data mesh

Un data mesh consente a un'organizzazione di trattare i dati come un prodotto, rendendoli individuabili e utilizzabili in un formato self-service. Questo approccio consente alle unità di business di creare e gestire i prodotti dati in modo indipendente. Inoltre, facilita una visualizzazione centralizzata dei dati su varie piattaforme e tecnologie, migliorando la connettività e gli insight senza la necessità di piattaforme di dati separate

LLM

I modelli linguistici di grandi dimensioni (LLM) possono semplificare l'ingegneria e le operazioni dei dati automatizzando attività come la profilazione, la modellazione e l'integrazione dei dati, portando a una migliore qualità dei dati stessi. L'implementazione dell'AI generativa all'interno delle infrastrutture di dati esistenti consente alle organizzazioni di gestire le attività di routine in modo più efficiente, liberando risorse per analisi e processi decisionali più complessi.

Soluzioni correlate

Soluzioni correlate

IBM Data Product Hub

IBM Data Product Hub aiuta a semplificare la condivisione dei dati e ad automatizzare la distribuzione dei prodotti di dati ai consumatori di dati all'interno dell'organizzazione.

Esplora il Data Product Hub di IBM

IBM Cloud Pak for Data

IBM Cloud Pak for Data aiuta a migliorare la qualità, la privacy e la conformità dei dati, e permette agli utenti di trovare più velocemente i dati di cui hanno bisogno.

Scopri IBM Cloud Pak for Data

IBM watsonx.data™

IBM watsonx.data è uno storage dei dati scalabile e ibrido, progettato per i workload di AI e analytics. Offre accesso ai dati aperto, motori di query adatti allo scopo e integrazione con vari ambienti di dati, consentendo una gestione e una preparazione dei dati efficiente su qualsiasi configurazione cloud oppure on-premise.

Esplora IBM® watsonx.data
Risorse correlate

Risorse correlate

IBM e TechD collaborano per condividere in modo sicuro i dati e potenziare gli insight con la gen AI

La partnership di IBM con TechD utilizza l’AI generativa per sbloccare insight e capacità decisionali basate sui dati, mantenendo una privacy robusta.

Che cos'è il data storage?

Le soluzioni avanzate di data storage sono fondamentali per garantire agilità, sicurezza e scalabilità aziendali, consentendo al contempo alle organizzazioni di gestire e utilizzare in modo efficiente i dati negli ambienti in evoluzione.

Realizza la tua strategia sui dati con un data fabric

Un’architettura di data fabric aiuta a semplificare l’accesso ai dati, ad abbattere i silos e a migliorare il processo decisionale fornendo dati pronti per il business in ambienti ibridi e multicloud.

Fai il passo successivo

Prova la condivisione dei dati senza interruzioni con IBM Data Product Hub, un hub digitale con strumenti per impacchettare e condividere dati da sistemi eterogenei senza il blocco da fornitore. Scopri e accedi ai prodotti di dati corretti da tutta l'organizzazione in modo efficiente, con guardrail per garantire che i prodotti dei dati siano condivisi e utilizzati in modo conforme.

Esplora IBM Data Product Hub Leggi il white paper di IDC
Note a piè di pagina

1 Data sharing for research (link esterno a IBM.com), The Future of Privacy Forum, agosto 2022

Knight Capital Group stock trading disruption (link esterno a IBM.com), Wikipedia, agosto 2012