"Data storage" si riferisce alla registrazione e conservazione di informazioni digitali su supporti magnetici, ottici o meccanici per operazioni in corso o future.
Esistono due tipi di informazioni digitali: i dati di input e i dati di output. Gli utenti forniscono i dati di input, mentre i computer forniscono i dati di output. Tuttavia, la CPU di un computer non può calcolare nulla né produrre dati di output senza l'input dell'utente.
Gli utenti possono inserire i dati di input direttamente in un computer. Tuttavia, all'inizio dell'era dei computer, si è compreso che la continua immissione manuale dei dati è proibitiva in termini di tempo ed energia. Una soluzione a breve termine è la memoria del computer, nota anche come memoria ad accesso casuale (RAM). Tuttavia, la sua capacità di storage e conservazione della memoria è limitata. La memoria di sola lettura (ROM) è, come suggerisce il nome, una memoria in cui i dati possono essere solo letti ma non necessariamente modificati. Questa memoria controlla le funzioni di base di un computer.
Sebbene gli informatici abbiano fatto progressi significativi nella memoria dei computer con lo sviluppo della RAM dinamica (DRAM) e della DRAM sincrona (SDRAM), sono ancora limitati dal costo, dallo spazio e dalla conservazione della memoria. Quando un computer si spegne, si spegne anche la capacità della RAM di conservare i dati. La soluzione? Il data storage.
Con il data storage, gli utenti possono salvare i dati su un dispositivo. Se il computer si spegne, i dati vengono conservati. Anziché inserire manualmente i dati in un computer, gli utenti possono dire al computer di estrarre i dati dai dispositivi di storage. I computer possono leggere i dati di input da varie origini in base alle esigenze e possono quindi creare e salvare l'output nelle stesse origini o in altre posizioni di storage. Gli utenti possono anche condividere l'archiviazione dei dati con altri utenti.
Le organizzazioni e gli utenti necessitano attualmente di data storage per soddisfare le esigenze computazionali di alto livello per l'analisi dei big data, l'intelligenza artificiale (AI), il machine learning (ML) e l'Internet of Things (IoT). La necessità un livello elevato di data storage introduce l'esigenza di proteggersi dalla perdita di dati a causa di disastri, guasti o frodi. Per evitare questa perdita di dati, le organizzazioni possono impiegare il data storage anche come soluzione di backup e ripristino.
In poche parole, i computer o i terminali moderni si collegano ai dispositivi di storage direttamente o tramite una rete. Gli utenti dicono ai computer di accedere ai dati e di memorizzarli su questi dispositivi di storage. Tuttavia, a un livello fondamentale, ci sono due basi per il data storage: la forma in cui i dati vengono presi e i dispositivi su cui vengono registrati e memorizzati.
Per memorizzare i dati, indipendentemente dal modulo, gli utenti necessitano di dispositivi di storage. I dispositivi di data storage si dividono in due categorie principali: storage diretto e storage basato sulla rete
Il direct area storage, o direct-attached storage (DAS) è un sistema di storage che si trova spesso nelle immediate vicinanze ed è direttamente collegato al computer che vi accede. Spesso, si tratta dell'unica macchina collegata. Il DAS può anche fornire servizi di backup accettabili, tuttavia la condivisione è limitata. I dispositivi DAS includono dischetti, dischi ottici (compact disc, CD), dischi video digitali (DVD), unità disco rigido (HDD), unità flash e solid-state drive (SSD).
Lo storage basato sulla rete consente a più computer di accedervi tramite una rete, rendendolo migliore per la condivisione e la collaborazione dei dati. La sua capacità di storage off-site lo rende anche più adatto per i backup e la protezione dei dati. Due configurazioni standard di storage basato sulla rete sono NAS (network-attached storage) e SAN (storage area network).
NAS è spesso un singolo dispositivo composto da container di storage ridondanti o da un array ridondante di dischi indipendenti (RAID). L'archiviazione SAN può consistere in una rete di dispositivi multipli di vario tipo, tra cui storage SSD e flash, storage ibrido, storage hybrid cloud, storage cloud e software e dispositivi di backup.
Ecco le differenze tra NAS e SAN:
NAS
SAN
.
Lo storage flash è una tecnologia solid-state drive che utilizza chip di memoria flash per scrivere e memorizzare i dati. Un'unità flash solid-state disk (SSD) archivia i dati utilizzando la memoria flash. Rispetto alle unità hard-disk drive (HDD), un sistema a stato solido non ha parti in movimento e ha una latenza minore, quindi ci sono meno SSD. Poiché la maggior parte delle moderne unità SSD si basa sulla memoria flash, l'archiviazione flash è sinonimo di sistema a stato solido.
Le unità SSD e flash offrono una velocità di elaborazione maggiore rispetto alle unità HDD, ma gli array all-flash possono essere più costosi. Molte organizzazioni adottano un approccio ibrido, che abbina la velocità delle unità flash alla capacità di storage dei dischi rigidi. Un'infrastruttura di storage bilanciata consente alle aziende di applicare una tecnologia specifica per soddisfare diverse esigenze di storage. L'hybrid storage offre un modo economico per effettuare la transizione dalle tradizionali unità HDD senza passare completamente a un'architettura flash.
storage cloud offre un'alternativa conveniente e scalabile alla memorizzazione dei file su dischi rigidi o reti di storage on-premise. I provider di servizi cloud (CSP), come Google Cloud, Microsoft Azure, IBM Cloud, Amazon Web Services (AWS), consentono di salvare dati e file in una sede esterna a cui è possibile accedere tramite la rete Internet pubblica o una connessione di rete privata dedicata. Il provider ospita, protegge, gestisce e mantiene i server e l'infrastruttura associata e garantisce che sia sempre possibile accedere ai dati quando necessario.
Lo storage hybrid cloud combina elementi di cloud privato e cloud pubblico. Con lo storage hybrid cloud, le organizzazioni possono scegliere in quale cloud memorizzare i dati. Ad esempio, i dati altamente regolamentati e soggetti a severi requisiti di archiviazione e replica sono più adatti a un ambiente di cloud privato, mentre i dati meno sensibili possono essere memorizzati nel cloud pubblico. Alcune organizzazioni utilizzano l'hybrid cloud per integrare le reti di storage interne con lo storage nel cloud pubblico.
Lo storage e i dispositivi di backup proteggono dalla perdita di dati causata da disastri, guasti o frodi. Eseguono copie periodiche dei dati e delle applicazioni su un dispositivo secondario separato e quindi utilizzano tali copie per il disaster recovery. I dispositivi di backup vanno dalle unità HDD e SSD alle unità nastro e i server.
I provider di servizi cloud (CSP) offrono anche il backup storage sotto forma di servizio, attraverso il backup-as-a-service (BaaS). Come la maggior parte delle soluzioni as-a-service, anche il BaaS rappresenta un'opzione a basso costo per proteggere i dati, salvandoli in una sede remota con opzioni di scalabilità
I dati possono essere registrati e memorizzati in tre forme principali: file storage, block storage e object storage.
Per un confronto più approfondito dei tipi di data storage, leggi “Object versus File versus Block Storage: What’s the Difference?” e guarda il seguente video.
Il file storage, o storage basato su file, è una metodologia di storage gerarchico utilizzata per organizzare e memorizzare i dati. In altre parole, i dati vengono memorizzati in file, che sono organizzati in cartelle, a loro volta organizzate in una gerarchia di directory e sottodirectory.
Il block storage, a volte chiamato storage a livello di blocco, è una tecnologia per la memorizzazione dei dati in blocchi. I blocchi vengono archiviati come pezzi separati, ciascuno con un identificatore univoco. Gli sviluppatori preferiscono il block storage per le situazioni che richiedono un trasferimento di dati rapido, efficiente e affidabile.
L'object storage, spesso chiamato storage basato su oggetti, è un'architettura di data storage per la gestione di grandi quantità di dati non strutturati. Questi dati non sono conformi o non possono essere organizzati facilmente in un database relazionale tradizionale con righe e colonne. Gli esempi includono e-mail, video, foto, pagine web, file audio, dati di sensori e altri media e contenuti web (testuali o non testuali). Altri casi d'uso includono la creazione di applicazioni cloud-native o la trasformazione di applicazioni legacy in applicazioni cloud di nuova generazione, utilizzando l'object storage basata su cloud come data store persistente.
La memoria del computer e le risorse di storage locali potrebbero non fornire uno storage sufficiente, la protezione dello storage, l'accesso multiutente o velocità e prestazioni per le applicazioni aziendali. La maggior parte delle organizzazioni utilizza quindi un qualche tipo di storage area network (SAN) oltre a un sistema di network-attached storage (NAS).
Talvolta chiamata "rete alle spalle dei server", una storage area network (SAN) è una rete specializzata ad alta velocità che collega server e dispositivi di storage. Comprende un'infrastruttura di comunicazione che fornisce connessioni fisiche, consentendo a un dispositivo any-to-any di collegarsi alla rete utilizzando elementi interconnessi, come switch e director.
La SAN può anche essere vista come un'estensione del concetto di bus di storage. Questo concetto consente ai dispositivi di storage e ai server di interconnettersi utilizzando elementi simili, come le local area network(LAN) e le wide-area network (WAN). Una SAN comprende anche un livello di gestione che organizza le connessioni, gli elementi di storage e i sistemi informatici. Questo livello garantisce trasferimenti di dati sicuri e robusti.
In genere, solo un numero limitato di dispositivi di storage può essere collegato a un server. In alternativa, una SAN ha introdotto la flessibilità di rete, consentendo a uno o più server eterogenei in più data center di condividere un'utility di storage comune. La SAN elimina la tradizionale connessione dedicata tra un server e lo storage. Elimina inoltre il concetto che il server possieda e gestisca efficacemente i dispositivi di storage. Pertanto, una rete potrebbe includere molti dispositivi di storage, tra cui dischi, nastri magnetici e dispositivi di storage ottici, e la utility di storage potrebbe trovarsi lontano dai server che utilizza.
L'infrastruttura di storage è alla base delle informazioni. Pertanto, deve supportare gli obiettivi e il modello di business dell'azienda. Un'infrastruttura SAN offre un grado maggiore di disponibilità della rete, accessibilità dei dati e gestibilità del sistema. In questo ambiente, non basta distribuire una maggiore quantità di dispositivi di storage più veloci. Una buona SAN inizia con una buona progettazione.
Il primo elemento da considerare in qualsiasi implementazione SAN è la connettività dei componenti storage e server, che in genere utilizzano Fibre Channel, una tecnologia di trasferimento dei dati ad alta velocità. Le SAN, come le LAN, interconnettono le interfacce di storage in molte configurazioni di rete e su lunghe distanze.
L'infrastruttura server è il motivo alla base di tutte le soluzioni SAN, e include una combinazione di piattaforme server. Iniziative come il consolidamento dei server e l'e-commerce aumentano la necessità di SAN, rendendo lo storage di rete più critico.
Un sistema di storage può essere costituito da sistemi a disco e sistemi a nastro. Il sistema a disco può includere unità HDD, SSD o Flash drive. Il sistema a nastro può includere unità nastro, autoloader e librerie a nastro.
La connettività SAN è costituita da componenti hardware e software che interconnettono dispositivi di storage e server. L'hardware può includere hub, switch, director e router.
Il data storage si è ormai evoluto verso un approccio software basato sullo storage definito dal software (SDS) e sulle tecnologie correlate, che aumentano l'agilità e l'efficienza nella gestione dei dati. Un rapporto di Technavio stima che la dimensione del mercato globale dello storage definito dal software (SDS) crescerà di 105,07 miliardi di USD nel 2024-2029.1
L'archiviazione definita dal software (SDS) è un tipo di archiviazione dei dati in cui un livello di software disaccoppia le risorse di storage dalla loro infrastruttura hardware di storage fisico sottostante. L'SDS utilizza la virtualizzazione per creare un pool unificato di risorse di storage che possono essere allocate dinamicamente attraverso l'automazione o manualmente attraverso una dashboard API.
A differenza dei tradizionali sistemi NAS o SAN, l'SDS offre la flessibilità necessaria per rispondere al complesso processo di trasformazione digitale. Ad esempio, l'SDS può semplificare in modo significativo le attività relative alla gestione dello storage automatizzando i workload relativi al provisioning, al monitoraggio e alla risoluzione dei problemi.
La storage virtualization si riferisce al pooling delle risorse di storage fisiche da più sistemi di storage, in modo che sembri che tutto lo storage sia memorizzato su un unico dispositivo. Al contrario, l'SDS astrae i servizi di storage e li separa dal dispositivo stesso. Gli utenti gestiscono la storage virtualization tramite una console per garantire la sicurezza, l'affidabilità e l'efficienza dei dati e delle risorse di storage per ambienti server e desktop virtualizzati.
Lo storage iperconvergente è un'architettura di storage dei dati in cui le risorse SDS vengono raggruppate e gestite all'interno di un'infrastruttura iperconvergente (HCI).
Lo storage iperconvergente integra tutto lo storage direttamente nello stack HCI, insieme alle funzioni di calcolo e di rete. Attraverso la virtualizzazione, l'HCI libera le risorse di storage dai singoli componenti hardware, rendendo lo storage iperconvergente molto più flessibile e scalabile rispetto alle soluzioni tradizionali.
La sicurezza del data storage protegge i dati on-premise e negli ambienti basati su cloud da violazioni dei dati, attacchi informatici e altre minacce alla sicurezza.
Le violazioni dei dati sono costose e rappresentano un problema continuo per le aziende. Secondo il report Cost of a Data Breach 2023, il costo medio globale della violazione dei dati in quell'anno è stato di 4,45 milioni di dollari, con un aumento del 15% in tre anni. Il rapporto ha anche rivelato che il risparmio medio per le organizzazioni che utilizzano molto l'automazione e l'AI per la sicurezza è pari a 1,76 milioni di dollari rispetto alle organizzazioni che non lo fanno.
Le aziende implementano misure di sicurezza dei dati per migliorare la visibilità dello storage dei dati. Le funzionalità hardware e software per la sicurezza dello storage includono autorizzazioni speciali, crittografia, mascheramento dei dati e oscuramento dei file sensibili. Le più recenti soluzioni software per la sicurezza dello storage aiutano anche ad automatizzare la reportistica, al fine di semplificare gli audit e rispettare i requisiti normativi.
Inoltre, la cyber resilience, ovvero la capacità dell'organizzazione di prevenire, resistere e riprendersi dagli incidenti di cybersecurity, è diventata parte integrante della sicurezza del data storage. La cyber resilience porta la sicurezza dei dati a un nuovo livello combinando il disaster recovery di continuità aziendale (BCDR), la sicurezza dei sistemi informativi e la resilienza organizzativa per aiutare le organizzazioni a scongiurare le minacce e salvaguardare i propri dati.
Attualmente, i settori che devono conservare i dati e mantenerne l'integrità, come sanità e pubblica amministrazione, possono optare per lo storage immutabile, che protegge i dati archiviati impedendo qualsiasi modifica o alterazione per un determinato periodo di tempo o per sempre. Questi file system consentono di accedere ripetutamente ai dati memorizzati una volta creati, ma non modificati, e possono aiutare a proteggere i dati da manomissioni, attacchi informatici e ransomware.
IBM Storage DS8000 è il sistema di storage più veloce, affidabile e sicuro per IBM zSystems e server IBM Power.
IBM Storage è una famiglia di hardware di data storage, storage software-defined e software di gestione dello storage.
IBM fornisce supporto proattivo per i server web e per l'infrastruttura dei data center al fine di ridurre i tempi di inattività e migliorare la disponibilità dell'IT.
1 Software-Defined Storage (SDS) Market size is set to grow by USD 105.07 billion 2024–2028, Surge in cloud adoption boosts the market (link resides outside ibm.com), Technavio, 24 giugno 2024.