Cos'è il disaster recovery (DR)?

Un'immagine di un uomo d'affari che utilizza un computer alla sua scrivania in un ufficio moderno.

Autori

Stephanie Susnjara

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

Cos'è il disaster recovery (DR)?

Il disaster recovery (DR) è un framework costituito da tecnologie IT e best practice progettate per prevenire o ridurre al minimo la perdita di dati e l'interruzione delle attività derivanti da eventi catastrofici.

Comprende tutto, dai guasti alle attrezzatura alle interruzioni all'energia locale, fino ad attacchi criminali o militari, attacchi informatici e disastri naturali.

Molte aziende, soprattutto le piccole e medie imprese, trascurano lo sviluppo di un piano di disaster recovery (DRP) affidabile e pratico. Senza un piano del genere, non saranno sufficientemente protette dall'impatto di gravi eventi dirompenti.

Il costo dei tempi di inattività non pianificati rende essenziale la protezione dalla perdita di dati. Secondo una ricerca di Splunk e Oxford Economics, il costo medio dei tempi di inattività può arrivare fino a 9.000 USD al minuto (o 540.000 USD all'ora) per le organizzazioni aziendali. Per gli istituti finanziari e sanitari, due settori ad alto rischio che gestiscono dati sensibili, il tempo di inattività può comportare costi superiori a 5 milioni di dollari all'ora.1 La pianificazione del disaster recovery può mitigare significativamente questi rischi.

Il disaster recovery comporta strategie, pianificazione, implementazione di tecnologie appropriate e implementazione di test continui. Sebbene i backup dei dati siano un componente fondamentale, un processo di backup and recovery da solo non costituisce un piano di disaster recovery.

Il disaster recovery prevede anche di garantire che siano disponibili adeguati storage e calcoli per mantenere procedure di failover e failback robuste. Il failover è il processo di offrire i workload ai sistemi di backup affinché i processi di produzione e le esperienze dell'utente finale vengano interrotte il meno possibile. Il failback comporta il ritorno ai sistemi primari originali.

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Cos'è il business continuity disaster recovery (BCDR)?

Il Business continuity disaster recovery (BCDR) è un processo che aiuta la tua organizzazione a ripristinare le normali operazioni aziendali in caso di disastro. La continuità aziendale e il disaster recovery hanno molte somiglianze, ma sono due approcci distinti.

Sebbene il BCDR sia talvolta definito come gestione delle emergenze in ambito aziendale, differisce notevolmente dai programmi del governo come la Federal Emergency Management Agency (FEMA). Questi programmi si concentrano sulle emergenze civili e forniscono sicurezza pubblica e assistenza in caso di calamità a livello di comunità, piuttosto che IT e operazioni organizzative.

Mixture of Experts | 12 dicembre, episodio 85

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Pianificazione di continuità aziendale e pianificazione di disaster recovery 

La pianificazione della continuità aziendale (BCP) consiste in sistemi e processi che garantiscono che tutte le aree di un'impresa mantengano o ripristinino rapidamente le operazioni essenziali in caso di crisi o emergenza.

La pianificazione del disaster recovery è un sottoinsieme della pianificazione della continuità aziendale che si concentra sul ripristino dell'infrastruttura e dei sistemi IT. Prevede un piano di disaster recovery (DRP) che mappa i passaggi di recupero da un evento imprevisto. Le aziende si affidano ai DRP per gestire varie situazioni di disastro (ad esempio, calamità naturali, ransomware, attacchi malware).

7 passaggi chiave nella pianificazione del disaster recovery

I seguenti sette passaggi sono fondamentali per una pianificazione efficace del disaster recovery:

  1. Eseguire un'analisi dell'impatto aziendale (BIA)
  2. Analizzare il rischio
  3. Dare priorità alle applicazioni
  4. Documentare le dipendenze
  5. Stabilire gli obiettivi di RTO, RPO e RCO
  6. Considerare le questioni di conformità normativa
  7. Implementare test e recensioni continue

1. Eseguire un'analisi dell'impatto aziendale (BIA)

La creazione di un piano di disaster recovery completo inizia con un'analisi dell'impatto aziendale (BIA). Quando si esegue questa analisi, si creeranno diversi scenari di disastro dettagliati che possono poi essere utilizzati per prevedere la dimensione e l'entità delle perdite subite nel caso in cui determinati processi aziendali vengano interrotti. Ad esempio, cosa succede se un incendio distrugge il tuo call center di servizio clienti? E se un terremoto colpisce la tua sede?

Questa analisi ti permette di identificare le funzioni aziendali più critiche e di determinare quanto tempo di inattività ciascuna di esse può tollerare. Con queste informazioni a disposizione, puoi iniziare a creare un piano per la manutenzione delle operazioni più critiche in vari scenari.

La pianificazione del disaster recovery per l'IT dovrebbe basarsi e supportare la pianificazione della continuità aziendale. Cosa succederebbe se, ad esempio, il tuo piano di continuità aziendale prevedesse che i rappresentanti del servizio clienti lavorassero da casa in seguito a un incendio in un call center? Quali tipi di hardware, software e risorse IT dovrebbero essere a disposizione per supportare questo piano?

2. Analizzare il rischio

Valutare la probabilità e le potenziali conseguenze dei rischi a cui è esposta la tua azienda è una componente fondamentale di una strategia di disaster recovery. Con la diffusione di attacchi informatici e ransomware, è fondamentale comprendere i rischi di cybersecurity che tutte le imprese affrontano oggi. Inoltre, è importante comprendere i rischi specifici del proprio settore e della propria posizione geografica.

Per vari scenari, inclusi disastri naturali, guasti di attrezzatura, minacce interne, sabotaggi ed errori dei dipendenti, è importante valutare i rischi e considerare l'impatto complessivo sulla propria azienda.

Poniti le seguenti domande: 

  • Quali perdite finanziarie potresti subire a causa di mancate opportunità di vendita o interruzioni delle attività generatrici di fatturato?
  • Che tipo di danni subirebbe la reputazione del tuo marchio? In che modo verrebbe influenzata la soddisfazione del cliente?
  • Come verrebbe influenzata la produttività dei dipendenti? Quante ore di lavoro potrebbero andare perse?
  • Quali rischi potrebbe rappresentare l'incidente per la salute o la sicurezza umana?
  • I progressi verso iniziative o obiettivi aziendali verrebbero influenzati? In che modo?

3. Dare priorità alle applicazioni

Non tutti i workload sono ugualmente critici per la capacità della tua azienda di mantenere le operazioni, e il tempo di inattività è molto più tollerabile per alcune applicazioni rispetto ad altre.

Dividi i tuoi sistemi IT e applicazioni in tre livelli, in base a quanto tempo puoi permetterti di mantenerli offline e alla gravità delle conseguenze della perdita di dati:

  1. Mission-critical: applicazioni il cui funzionamento è essenziale per la sopravvivenza della tua azienda.
  2. Importanti: applicazioni per le quali si possono tollerare periodi di tempo di inattività relativamente brevi.
  3. Non essenziali: applicazioni che potresti sostituire temporaneamente con processi manuali o farne a meno.

4. Documentare le dipendenze

Il passo successivo nella pianificazione del disaster recovery è creare un inventario completo degli asset hardware e software. In questa fase, è essenziale comprendere le interdipendenze critiche delle applicazioni. Se un'applicazione software si blocca, quali altre saranno interessate?

Progettare modelli di resilienza dei dati e disaster recovery nei sistemi quando vengono inizialmente integrati è il modo migliore per gestire le interdipendenze delle applicazioni. È fin troppo comune con le architetture moderne basate sui microservizi scoprire processi che non possono essere avviati quando altri sistemi o processi sono inattivi e viceversa.

Riprendersi da questa situazione non è facile. È anche fondamentale scoprire tali problemi quando si ha il tempo di sviluppare piani alternativi per i sistemi e i processi, prima che si verifichi un vero e proprio disastro.

5. Stabilire gli obiettivi RTO, RPO e RCO

Considerando le analisi dei rischi e dell'impatto aziendale, dovresti essere in grado di stabilire obiettivi multipli. Questi obiettivi includono quanto tempo ci vuole per rimettere in funzione i sistemi, quanti dati puoi permetterti di perdere e quanta corruzione o deviazione dei dati puoi tollerare.

  • Il tuo obiettivo di tempo di recupero (RTO) è il tempo massimo necessario per ripristinare il funzionamento di un'applicazione o di un sistema dopo un'interruzione del servizio.
  • Il tuo obiettivo di punto di recupero (RPO) è l'età massima dei dati da recuperare affinché la tua azienda riprenda le operazioni regolari. Per alcune aziende, perdere anche solo pochi minuti di dati può essere catastrofico, mentre altre in altri settori potrebbero essere in grado di tollerare finestre temporali più lunghe.
  • Il tuo obiettivo di coerenza nel recupero (RCO) è una metrica utilizzata nei servizi di protezione dei dati. Questa metrica indica quante voci incoerenti nei dati aziendali provenienti da processi o sistemi recuperati siano tollerabili in situazioni di disaster recovery. Descrive l'integrità dei dati aziendali attraverso ambienti applicativi complessi.

6. Considerare i problemi di conformità normativa

Tutti i software e le soluzioni di disaster recovery implementati dalla tua azienda devono soddisfare i requisiti di protezione e sicurezza dei dati a cui sei tenuto a aderire. Ciò significa che tutti i sistemi di data backup e failover dei dati devono essere progettati per rispettare gli stessi standard progettati per garantire la riservatezza e l'integrità dei dati dei sistemi principali.

Allo stesso tempo, diversi standard normativi stabiliscono che tutte le aziende debbano mantenere piani di disaster recovery e continuità aziendale. Il Sarbanes-Oxley Act (SOX), ad esempio, richiede a tutte le società quotate negli Stati Uniti di conservare copie di tutti i registri aziendali per un minimo di cinque anni.

Il mancato rispetto di questa normativa (inclusa l'incapacità di stabilire e testare sistemi di data backup adeguati) può comportare sanzioni pecuniarie significative per le aziende, o addirittura il carcere per i loro leader.

7. Implementare test e recensioni continui

In parole povere, se il tuo piano di disaster recovery non è stato testato, non puoi fare affidamento su di esso. Tutti i dipendenti con responsabilità pertinenti devono partecipare all'esercizio di test di disaster recovery, che può comportare il mantenimento delle operazioni dal sito di failover per un periodo specificato.

Se eseguire test completi di disaster recovery è al di fuori del tuo budget o delle tue funzionalità, puoi anche programmare un'"esercitazione" delle procedure di test. Tuttavia, è meno probabile che questo tipo di test riveli anomalie o debolezze nelle procedure di DR rispetto a un test completo, specialmente la presenza di interdipendenze di applicazione precedentemente sconosciute.

Poiché gli asset hardware e software cambiano nel tempo, è necessario assicurarsi che il disaster recovery venga aggiornato di conseguenza. Pertanto, è importante rivedere e controllare periodicamente il piano su base continuativa.

 Clicca qui per vedere un esempio di piano di disaster recovery.

Vantaggi del disaster recovery

Il disaster recovery offre benefici essenziali, tra cui:

  • Continuità aziendale: aiuta le aziende a riprendere le normali operazioni dopo un evento non pianificato.

  • Elevata disponibilità (HA): Garantisce un'elevata disponibilità abilitando un failover automatico o rapido verso un sistema ridondante quando il sistema principale si guasta.

  • Tempi di inattività ridotti: ripristina sistemi e app essenziali, offrendo interruzioni minime.

  • Risparmio sui costi: riduce le perdite finanziarie associate ai tempi di inattività e alla perdita di dati.

  • Maggiore sicurezza dei dati e conformità: consente alle aziende di proteggere i propri dati e di rispettare le leggi sulla privacy e le normative di settore.

  • Consolidamento della fiducia dei clienti: mantiene la fiducia dei clienti assicurando la fornitura di servizi coerenti e proteggendo i dati dei clienti anche in caso di guasti del sistema o disastri.

Tipi di soluzioni di disaster recovery

Il disaster recovery comprende i seguenti tipi di tecnologie e soluzioni:

  • Siti di disaster recovery
  • Backup
  • Replica basata su snapshot
  • Cloud DR
  • Disaster Recovery as a Service (DRaaS)

Siti di disaster recovery

Costruire il proprio data center per il disaster recovery comporta trovare un equilibrio tra diversi obiettivi in competizione.

Tuttavia, una copia dei tuoi dati dovrebbe essere memorizzata in un luogo geograficamente abbastanza distante dalla sede centrale o dall'ufficio. In questo modo, gli stessi eventi sismici, le minacce ambientali o altri pericoli che colpiscono la sede principale non potranno distruggere permanentemente i tuoi dati.

Tuttavia, i backup memorizzati esternamente richiedono più tempo per essere ripristinati rispetto a quelli memorizzati on-premise nel sito principale. Inoltre, la latenza di rete può essere ancora maggiore su distanze maggiori.

 

Backup

Il backup e il ripristino costituiscono la base su cui costruire qualsiasi solido piano di disaster recovery.

  • Nastri e primi dischi: in passato, la maggior parte delle aziende si affidava a nastri e dischi rotanti (ad esempio, unità disco rigido (HDD)) per i backup. Mantenevano più copie dei loro dati e ne memorizzavano almeno una in una sede esterna.
  • Backup moderni basati su disco: quando le organizzazioni hanno abbandonato il nastro, i sistemi basati su disco sono diventati lo standard per l'archiviazione dei backup, anche grazie al fatto che offrono funzionalità più veloci. Le moderne soluzioni basate su disco utilizzano dischi rigidi o solid-state drive (SSD) in configurazioni di storage locale, NAS o SAN . Questo cambiamento ridusse drasticamente i tempi di recupero rispetto ai sistemi basati su nastro.

Replica basata su snapshot

Il backup dei database basato su snapshot acquisisce lo stato attuale di un'applicazione o di un disco in un determinato momento. Scrivendo solo i dati modificati dall'ultima istantanea, questo metodo può aiutare a proteggere i dati pur conservando spazio di storage.

Gli snapshot possono essere replicati in altre località o memorizzati nel cloud per scopi di disaster recovery.

Cloud DR (cloud disaster recovery)

Cloud DR utilizza infrastrutture e servizi basati su cloud per fare backup e recuperare dati e applicazioni, eliminando la necessità di mantenere data center secondari fisici.

Ti permette di proteggere i dati dell'applicazione e l'intera infrastruttura server, incluse le macchine fisiche o macchine virtuali (VM) che utilizzano impostazioni di cloud pubblico o di fornitori di servizi dedicati. Puoi configurare i programmi di backup in base alle tue esigenze specifiche.

Le soluzioni di backup cloud possono anche integrarsi con piattaforme di virtualizzazione come VMware o soluzioni di backup cloud-native. Questi approcci offrono scalabilità flessibile e ottimizzazione dei costi man mano che le tue esigenze di storage evolvono e supportano le organizzazioni in fase di migrazione verso il cloud

Disaster recovery as a service (DRaaS)

Disaster recovery as a service (DRaaS) è una soluzione di terze parti basata su cloud che offre funzionalità di protezione dei dati e di disaster recovery (DR) su richiesta e con pagamento a consumo.

Il DRaaS è una delle offerte di servizi IT gestiti più diffuse e in rapida crescita oggi disponibili. Uno studio di settore del 2023 ha previsto che il mercato DRaaS crescerà da 10,7 miliardi di dollari a 26,5 miliardi di dollari entro il 2028 a un tasso di crescita annuale composto.2

Con DRaaS, il tuo fornitore di servizi documenta RTO e RPO in un accordo di livello di servizio (SLA) che definisce i limiti di tempo di inattività e le aspettative di recupero delle applicazioni.

Le offerte DRaaS includono tipicamente anche operazioni di recupero delle applicazioni basate su cloud. Questo approccio offre risparmi significativi rispetto al mantenimento di risorse hardware dedicate ridondanti nel proprio data center. Esistono contratti in cui si paga una tariffa per il mantenimento delle funzionalità di failover, più i costi per utilizzo delle risorse consumate in una situazione di disaster recovery. In questo modo, il tuo fornitore si assume tipicamente tutta la responsabilità di configurare e mantenere l'ambiente di failover.

DRaaS contro DR

Se hai già sviluppato una soluzione di disaster recovery (DR) on-premise, può essere difficile valutare i costi e i vantaggi della sua manutenzione rispetto al passaggio a un abbonamento DRaaS mensile.

La maggior parte delle soluzioni DR on-premise comporta costi per hardware, alimentazione, manodopera per manutenzione e amministrazione, software e connettività di rete. Oltre alle spese iniziali necessarie nella configurazione iniziale del tuo ambiente DR, è necessario prevedere un budget per aggiornamenti software regolari.

Poiché la tua soluzione DR deve rimanere compatibile con l'ambiente di produzione principale, dovresti assicurarti che la tua soluzione DR abbia le stesse versioni software. A seconda delle specifiche del contratto di licenza, i costi del software potrebbero addirittura raddoppiare.

Se stai prendendo in considerazione soluzioni DRaaS di terze parti, assicurati che il fornitore abbia la capacità di eseguire backup multi-sito e interregionali. Se un evento meteorologico catastrofico (ad esempio un uragano) dovesse avere un impatto sulla sede principale del tuo ufficio, il sito di failover sarebbe sufficientemente lontano da non essere interessato dalla tempesta?

Se molti dei clienti del tuo fornitore nella tua zona fossero interessati contemporaneamente, il tuo fornitore avrebbe una capacità sufficiente per soddisfare le loro esigenze combinate? Ti affidi al tuo fornitore DRaaS per soddisfare gli RTO e gli RPO in tempi di crisi, quindi cerca un fornitore di servizi con una solida reputazione di affidabilità.

Per una panoramica comparativa più approfondita di entrambe le soluzioni, consulta: "Disaster recovery as a service (DRaaS) o disaster recovery (DR): quale ti serve?"

Disaster recovery e AI

L'integrazione dell'intelligenza artificiale (AI) sta trasformando il disaster recovery con caratteristiche che migliorano il rilevamento delle minacce, automatizzano la risposta agli incidenti e semplificano la gestione in ambienti ibridi e multicloud.

Nel report Report Cost of a Data Breach di IBM del 2025, i costi globali medi sono diminuiti da 4,88 milioni di USD a 4,44 milioni di USD, con una diminuzione del 9%. Secondo il report, le organizzazioni sono riuscite a identificare e contenere una violazione entro un tempo mediano di 241 giorni, il minimo registrato negli ultimi 9 anni.

L'AI nel disaster recovery offre i seguenti vantaggi fondamentali:

  • Analytics predittiva: i modelli AI analizzano i dati storici per prevedere potenziali guasti o violazioni di sicurezza prima che si verifichino. Questo processo abilita l'analytics predittiva e supporta la mitigazione del rischio.
  • Monitoraggio in tempo reale: gli algoritmi di sistema di machine learning (ML) aiutano a monitorare lo stato di salute dell'infrastruttura in tempo reale. Gli avvisi aiutano i team a rilevare anomalie e a prevenire tempi di inattività o perdita di dati.
  • Risposte automatiche: l'automazione basata sull'AI può offrire procedure di recupero più rapide rispetto all'intervento umano, riducendo significativamente RTO e RPO.
  • Assistenza all'AI generativa: i modelli linguistici di grandi dimensioni (LLM) migliorano i workflow di DR analizzando i log per l'analisi della causa principale, generando automaticamente la documentazione degli incidenti e fornendo interfacce conversazionali per supportare un rapido recupero. Questo processo aiuta i team a tradurre i dati in passaggi fruibili.
Soluzioni correlate
IBM Storage Defender

Proteggi i tuoi dati dalle minacce in evoluzione, indipendentemente dal luogo in cui sono archiviati, grazie al backup, al rilevamento basato sull'AI e al ripristino rapido.

Esplora Storage Defender
Data backup and recovery dello storage

Accelera i processi aziendali di backup e ripristino che consentono di recuperare i dati e ripristinare i servizi IT con rapidità per i workload on-premise e nel cloud. 

Esplora le soluzioni di backup e ripristino
Soluzioni di disaster recovery per il cloud

Proteggi i tuoi dati con un piano di disaster recovery per il cloud e riduci il rischio di tempi di inattività.

Esplora il disaster recovery per il cloud
Fai il passo successivo

Mantieni i tuoi dati al sicuro e i tuoi workload disponibili con il rilevamento tempestivo delle minacce, i livelli di protezione e il ripristino rapido. Scopri in che modo IBM Storage Defender può aiutarti a proteggere la supply chain delle informazioni.

Esplora Storage Defender Prenota una demo live
Note a piè di pagina