Cos'è lo storage dei dati?

Lo storage dei dati si riferisce ai supporti magnetici, ottici o meccanici che registrano e conservano informazioni digitali per operazioni in corso o future.

In the Modern Data Center: Engineer and IT Specialist Work with Server Racks, on a Pushcart Equipment for Installing New Hardware. Specialists Doing Maintenance and Diagnostics of the Database.

Una definizione dello storage dei dati

Esistono due tipi di informazioni digitali: dati di input e dati di output. Gli utenti forniscono i dati di input. I computer forniscono i dati di output. La CPU di un computer, però, non può calcolare niente o produrre dati di output senza l'input di un utente. 

Gli utenti possono immettere i dati di input direttamente in un computer. Tuttavia, ci si è resi conto già all'inizio dell'era dei computer che immettere continuamente dati in modo manuale era proibitivo in termini di tempo ed energie. Una soluzione a breve termine è la memoria del computer, nota anche come RAM (random access memory). La sua capacità di storage e la sua conservazione in memoria erano però limitate. La ROM (read-only memory) è la memoria in cui, come suggerisce il nome, i dati possono essere solo letti ma non necessariamente modificati. Controllano la funzionalità di base di un computer. 

Sebbene siano stati fatti dei progressi nella memoria del computer con la DRAM (dynamic RAM) e la SDRAM (synchronous DRAM), sono ancora limitate dal costo, dallo spazio e dalla conservazione in memoria. Quando un computer si spegne, lo stesso accade alla capacità della RAM di conservare i dati. La soluzione? Storage dei dati. 

Con lo spazio di storage dei dati, gli utenti possono salvare i dati su un dispositivo. Così, in caso di spegnimento del computer, i dati vengono conservati. Invece poi di immettere manualmente i dati in un computer, gli utenti possono indicare al computer di estrarre i dati dai dispositivi di storage. I computer possono leggere i dati di input da diverse origini come necessario e possono quindi creare e salvare l'output nelle stesse origini oppure in altre ubicazioni di storage. Gli utenti possono anche condividere lo storage dei dati con altri utenti. 

Oggi le organizzazioni e gli utenti richiedono che lo storage dei dati soddisfi le attuali esigenze computazionali di alto livello come i progetti di big data, l'AI (artificial intelligence), il ML (machine learning) e IoT (Internet of Things). L'altro aspetto poi dell'esigenza di grandi quantità di storage dei dati è la protezione da perdite di dati dovute a disastri, malfunzionamenti o frodi. Quindi, per evitare perdite di dati, le organizzazioni possono anche utilizzare lo storage dei dati come soluzioni di backup. 

Come funziona lo storage dei dati
In parole semplici, i computer o i terminali moderni si connettono ai dispositivi di storage direttamente o tramite una rete. Gli utenti indicano ai computer di accedere ai dati da tali dispositivi di storage e di archiviarvi i dati. Tuttavia, a un livello fondamentale, due sono le basi su cui poggia lo storage dei dati: il formato assunto dai dati e i dispositivi sui cui vengono registrati e archiviati i dati.


Dispositivi di storage dei dati

Per archiviare i dati, indipendentemente dal formato, gli utenti hanno bisogno di dispositivi di storage. I dispositivi di storage dei dati sono disponibili in due categorie principali: storage diretto nell'area e storage basato sulla rete. 

Lo storage diretto nell'area, noto anche come DAS (Direct Attached Storage), è ciò che il nome implica. Questo storage è spesso nell'area circostante e direttamente connessa alla macchina di calcolo che vi accede. Spesso è l'unica macchina connessa ad esso. DAS può anche fornire dei servizi di backup locali decenti ma la condivisione è limitata. I dispositivi DAS includono i dischi floppy, i dischi ottici - CD (compact disk) e DVD (digital video disc) - le HDD (hard disk drive), le unità flash e le SSD (solid-state drive). 

Lo storage basato sulla rete consente a più di un computer di accedervi tramite una rete, rendendolo più indicato per la condivisione dei dati e la collaborazione. La sua capacità di storage off-site lo rende anche più adatto per i backup e la protezione dei dati. Due configurazioni comuni di storage basato sulla rete sono NAS (Network Attached Storage) e SAN (Storage Area Network). 

NAS è spesso un singolo dispositivo costituito da container di storage ridondanti o un RAID (Redundant Array of Independent Disks). Lo storage SAN può essere una rete di più dispositivi di diversi tipi, compresi SSD e storage flash, storage ibrido, storage su cloud ibrido, software e appliance di backup e storage su cloud. Ecco come differiscono NAS e SAN:

NAS

  • Dispositivo di storage singolo o RAID
  • Sistema di storage di file
  • Rete Ethernet TCP/IP
  • Utenti limitati
  • Velocità limitata
  • Opzioni di espansione limitate
  • Costo più basso e configurazione facile

SAN

  • Rete di più dispositivi
  • Sistema di storage a blocchi
  • Rete Fibre Channel
  • Ottimizzata per più utenti
  • Prestazioni più veloci
  • Altamente espandibile
  • Costo più elevato e configurazione complessa

Tipi di dispositivi di storage

SSD e storage flash

Lo storage flash è una tecnologia a stato solido che utilizza chip di memoria flash per la scrittura e l'archiviazione dei dati. Una unità flash SSD (Solid State Disk) archivia i dati utilizzando la memoria flash. Rispetto alle HDD, un sistema a stato solido è privo di parti in movimento e comporta pertanto una minore latenza e sono quindi richieste meno SSD. Poiché la maggior parte delle SSD moderne è basata su flash, lo storage flash è sinonimo di sistema a stato solido.

Storage ibrido

SSD e flash forniscono una velocità di trasmissione più elevata rispetto alle HDD, ma degli array all-flash possono essere più costosi. Molte organizzazioni adottano un approccio ibrido, combinando la velocità di flash con la capacità di storage dei dischi fissi. Un'infrastruttura di storage equilibrata consente alle aziende di applicare la tecnologia adatta per diverse esigenze di storage. Offre un modo economico per eseguire la transizione dalle HDD tradizionali senza passare completamente a flash.

Storage su cloud

Lo storage su cloud offre un'alternativa scalabile ed efficiente in termini di costi all'archiviazione di file su dischi fissi on-premise o su reti di storage. I provider di servizi cloud ti consentono di salvare dati e file in un'ubicazione off-site a cui accedi tramite la rete internet pubblica o una connessione di rete privata dedicata. Il provider ospita, protegge, gestisce e manutiene i server e l'infrastruttura associata e garantisce che tu disponga dell'accesso ai dati ogni qualvolta tu ne abbia bisogno.

Storage su cloud ibrido

Lo storage su cloud ibrido combina elementi di cloud privato e pubblico. Con lo storage su cloud ibrido, le organizzazioni possono scegliere il cloud su cui archiviare i dati. Ad esempio, per dei dati altamente regolamentati soggetti a rigidi requisiti di archiviazione e replica è di norma più indicato un ambiente cloud privato. I dati meno sensibili possono invece essere archiviati nel cloud pubblico. Alcune organizzazioni utilizzano i cloud ibridi per integrare le loro reti di storage interne con lo storage su cloud pubblico.

Software e appliance di backup

Lo storage e le appliance di backup proteggono dalle perdite di date causate da disastri, malfunzionamenti o frodi. Creano delle copie periodiche dei dati e delle applicazioni su un dispositivo secondario separato e utilizzano quindi queste copie per il disaster recovery. Le appliance di backup vanno da HDD ed SSD a unità nastro e server, ma lo storage di backup può anche essere offerto come un servizio, noto come BaaS (backup-as-a-service). Come la maggior parte delle soluzioni as-a-service, BaaS fornisce un'opzione a basso costo per proteggere i dati, salvandoli in un'ubicazione remota con scalabilità.

Formati dello storage dei dati

I dati possono essere registrati e archiviati in tre formati principali: storage di file, storage a blocchi e storage di oggetti.

Storage di file

Lo storage di file, indicato anche come storage a livello di file o basato sui file, è una metodologia di storage gerarchico utilizzata per organizzare e archiviare i dati. In altro parole, i dati vengono archiviati in file, i file vengono organizzati in cartelle e le cartelle vengono organizzate in una gerarchia di directory e sottodirectory.

Storage a blocchi

Lo storage a blocchi, a volte indicato come storage a livello di blocchi, è una tecnologia utilizzata per archiviare i dati in blocchi. I blocchi vengono quindi archiviati come componenti separati, ciascuno con un identificativo univoco. Gli sviluppatori preferiscono lo storage a blocchi per le situazioni di calcolo che richiedono un trasferimento dei dati rapido, efficiente e affidabile.

Storage di oggetti

Lo storage di oggetti, spesso indicato come storage basato sugli oggetti, è un'architettura di storage dei dati per gestire grandi quantità di dati non strutturati. Questi dati non sono conformi a, o non possono essere facilmente organizzati in, un tradizionale database relazionale con righe e colonne. Degli esempi includono e-mail, video, foto, pagine web, file audio, dati dei sensori e altri tipi di contenuto multimediale e web (testuale o non testuale).

Storage dei dati per il business

La memoria del computer e lo storage locale potrebbero non fornire abbastanza storage, protezione dello storage, accesso a più utenti, velocità e prestazioni per le applicazioni aziendali. Pertanto, la maggior parte delle organizzazioni adotta qualche forma di SAN in aggiunta a un sistema di storage NAS.

SAN
A volte indicata come la rete dietro i server, una SAN è una rete ad alta velocità specializzata che collega server e dispositivi di storage. Si articola in un'infrastruttura per le comunicazioni, che fornisce connessioni fisiche, consentendo a un dispositivo Any-to-Any di estendersi attraverso la rete utilizzando elementi interconnessi, come switch e director. La SAN può anche essere vista come un'estensione del concetto di bus di storage. Questo concetto consente ai server e ai dispositivi di storage di interconnettersi utilizzando elementi simili, come le LAN (Local Area Network) e le WAN (Wide Area Network). Una SAN include anche un livello di gestione che organizza le connessioni, gli elementi di storage e i sistemi di computer. Questo livello garantisce dei trasferimenti di dati protetti e affidabili. 

Solitamente, solo un numero limitato di dispositivi di storage può collegarsi a un server. In alternativa, una SAN introduce la flessibilità di rete consentendo a un singolo server, o a molti server eterogenei in più data center, di condividere un programma di utilità di storage comune. La SAN elimina anche la tradizionale connessione dedicata tra un server e lo storage e il concetto che il server in effetti possieda e gestisca i dispositivi di storage. Una rete potrebbe quindi includere molti dispositivi di storage, compresi dischi, nastri magnetici e storage ottico. Il programma di utilità di storage potrebbe poi trovarsi lontano dai server che utilizza.

Componenti SAN 
L'infrastruttura di storage è la base da cui dipendono le informazioni. Pertanto, l'infrastruttura di storage deve supportare gli obiettivi e il modello di business dell'azienda. Un'infrastruttura SAN fornisce una disponibilità di rete, un'accessibilità dei dati e una gestibilità del sistema migliorate. In questo ambiente, limitarsi a implementare dei dispositivi di storage più veloci e in maggior numero non è sufficiente. Una buona SAN inizia con una buona progettazione. 

I componenti principali di una SAN sono Fibre Channel, server, appliance di storage e hardware e software di rete. 

Fibre Channel

Il primo elemento da considerare in qualsiasi implementazione SAN è la connettività dei componenti di storage e server, che di norma utilizzano Fibre Channel. Le SAN, come le LAN, interconnettono tra loro le interfacce di storage in molte configurazioni di rete e su distanze maggiori.

Infrastruttura server

L'infrastruttura server è il motivo sottostante per tutte le soluzioni SAN e include una combinazione di piattaforme server. Con iniziative quali il consolidamento dei server e il commercio su Internet, l'esigenza di reti SAN aumenta, aumentando l'importanza dello storage di rete.

Sistema di storage

Un sistema di storage può essere costituito da sistemi disco e sistemi nastro. Il sistema disco può includere HDD, SSD o unità Flash. Il sistema nastro può includere unità nastro, autoloader nastro e librerie nastro.

Sistema di rete

La connettività SAN consiste in componenti hardware e software che interconnettono server e dispositivi di storage. L'hardware può includere hub, switch, director e router.


Soluzioni

Soluzioni di storage dei dati

Trasforma e migliora il tuo business con una soluzione di storage completa che integra e aggiorna la tua infrastruttura IT esistente, riducendo al contempo i costi.


Storage flash

Con una tecnologia all-flash basata su un'unica piattaforma, elimina i vari silos semplificando la gestione dei tuoi dati on-premise o nel cloud.


Virtualizzazione dello storage

Riduci i costi e la complessità con la virtualizzazione dello storage. Lo storage virtualizzato consente di centralizzare la gestione per semplificare gli ambienti misti e scoprire la capacità nascosta.


Tecnologia di storage su nastro

Esplora una tecnologia di storage su nastro affidabile con protezione air-gap, conservazione a lungo termine, cyber-resiliente e con consumo efficiente di energia, a un costo inferiore rispetto ad altri supporti. Conserva, proteggi e rendi sicuri i tuoi dati, in modo conveniente, con lo storage su nastro IBM.


SDS (software-defined storage)

SDS (software-defined software) significa soluzioni di storage più intelligenti. Separa l'intelligence e la funzionalità dall'hardware di storage per la migliore configurazione di storage possibile senza compromessi.


Storage cloud privato

Ottieni lo storage su cloud privato che ti servirà per raggiungere i tuoi obiettivi.