Oggi esistono tre tipi distinti di archivi di cloud storage, ognuno dei quali serve uno scopo diverso per rispondere a un'esigenza specifica:

Data lake

Un data lake è un grande archivio di dati non elaborati, sia non strutturati che semi-strutturati. Questi dati vengono aggregati da varie fonti e memorizzati. Non vengono modificati per soddisfare uno scopo specifico o per adattarsi a un formato particolare. La preparazione dei dati per l'analisi è un lungo processo di pulizia e riformattazione per renderli uniforme. I data lake sono ottime risorse per le organizzazioni che memorizzano informazioni relative a interruzioni, traffico, criminalità o dati demografici. I dati possono essere utilizzati in un secondo momento per aggiornare i budget e le risorse del DPW o dei servizi di emergenza.

Data warehouse

Un data warehouse è un'aggregazione di dati provenienti da diverse fonti in un unico archivio centralizzato che unifica le qualità e il formato dei dati, cosa che lo rende utile per i data scientist nel data mining, nell'intelligenza artificiale (AI), nel machine learning e, in ultima analisi, nell'analytics aziendale e nella business intelligence. Il data warehousing può essere utilizzato da una grande città per aggregare le transazioni elettroniche di vari dipartimenti, tra cui le multe per eccesso di velocità, le licenze per i cani, i pagamenti delle accise e altre transazioni. Questi dati strutturati verranno analizzati dal comune per emettere fatture di follow-up e aggiornare i dati del censimento e i registri della polizia, o verranno utilizzati dagli sviluppatori per aggregare terabyte di dati generati dai sensori sulle automobili per aiutare nel processo decisionale e trovare una soluzione di guida autonoma.