My IBM Accedi Iscriviti

Come costruire una strategia di disaster recovery di successo

19 gennaio 2024

Tempo di lettura: 6 minuti

Indipendentemente dal fatto che un settore debba affrontare sfide derivanti da conflitti geopolitici, conseguenze di una pandemia globale o crescenti aggressioni nello spazio della cybersecurity, i vettori di minaccia per le aziende moderne sono innegabilmente potenti. Le strategie di disaster recovery forniscono ai membri del team il framework per rimettere in funzione un'azienda dopo un evento non pianificato.

In tutto il mondo, la popolarità delle strategie di disaster recovery sta comprensibilmente aumentando. L'anno scorso, le aziende hanno speso 219 miliardi di dollari solo in soluzioni e cybersecurity , un aumento del 12% rispetto al 2022, secondo un recente rapporto dell'International Data Corporation (IDC) (link esterno a ibm.com).

Una strategia di disaster recovery illustra come le aziende risponderanno a una serie di incidenti non pianificati. Le solide strategie di disaster recovery sono costituite da piani di disaster recovery (piani DR), piani di continuità aziendale (BCP) e piani di risposta agli incidenti (IRP). Nel complesso, questi documenti aiutano a garantire che le aziende siano preparate ad affrontare una serie di minacce, tra cui interruzioni di corrente,  attacchi ransomware e malware , disastri naturali e molto altro ancora.

Che cos’è un piano di disaster recovery (DRP)?

I piani di disaster recovery (DRP) sono documenti dettagliati che descrivono come le aziende risponderanno ai diversi tipi di disastri. In genere, le aziende creano autonomamente i DRP o esternalizzano il processo di disaster recovery affidandolo a un fornitore di DRP di terze parti. Insieme ai piani di continuità aziendale (BCP) e ai piani di risposta agli incidenti (IRP), i DRP svolgono un ruolo fondamentale nell'efficacia della strategia di disaster recovery.

Che cosa sono i piani di continuità aziendale e i piani di risposta agli incidenti?

Come i DRP, i BCP e gli IRP fanno entrambi parte di una più ampia strategia di disaster recovery su cui un'azienda può fare affidamento per ripristinare le normali operazioni in caso di disastro. I BCP in genere esaminano in modo più ampio le minacce e le opzioni di risoluzione rispetto ai DRP, concentrandosi su ciò di cui un'azienda ha bisogno per ripristinare la connettività. Gli IRP sono un tipo di DRP che si concentra esclusivamente sugli attacchi informatici e sulle minacce ai sistemi IT. Gli IRP delineano chiaramente la risposta alle emergenze in tempo reale di un'organizzazione , dal momento in cui viene rilevata una minaccia fino alla sua mitigazione e risoluzione. 

Perché avere una strategia di disaster recovery è importante

I disastri possono avere un impatto sulle aziende in modi diversi, causando problemi complessi di ogni tipo. Da un terremoto che influisce sull'infrastruttura fisica e sulla sicurezza dei lavoratori a un'interruzione dei servizi cloud che chiude l'accesso a data storage sensibili e al servizio clienti, disporre di una solida strategia di disaster recovery aiuta a garantire che le aziende si riprendano rapidamente. Ecco alcuni dei maggiori benefici della creazione di una solida strategia di disaster recovery:

  • Mantenimento della continuità aziendale: la continuità aziendale e il disaster recovery per la continuità aziendale (BCDR) aiutano a garantire che le organizzazioni tornino alle normali operazioni dopo un evento non pianificato, fornendo protezione dei dati, data backup e altri servizi critici.
  • Riduzione dei costi: secondo il recente report Cost of Data Breach Report di IBM, il costo medio di una violazione dei dati nel 2023 è stato di 4,45 milioni di dollari, con un aumento del 15% nell'arco di tre anni. Le aziende che non dispongono di strategie di disaster recovery rischiano costi e sanzioni che potrebbero superare di gran lunga il denaro risparmiato non investendo nella soluzione.
  • Minori tempi di inattività: le aziende moderne si affidano a tecnologie complesse come soluzioni infrastrutturali basate su cloud e reti cellulari. Un incidente non pianificato che interrompe le operazioni aziendali può costare milioni. Inoltre, la natura di alto profilo degli attacchi informatici, i lunghi tempi di inattività o le interruzioni dovute a errori umani possono causare la fuga di clienti e investitori.
  • Mantenimento della conformità: le aziende che operano in settori fortemente regolamentati come l'assistenza sanitaria e la finanza personale devono affrontare pesanti multe e sanzioni per le violazioni dei dati a causa della natura critica dei dati che gestiscono. Avere una solida strategia di disaster recovery aiuta ad abbreviare i processi di risposta e ripristino dopo un incidente non pianificato, il che è fondamentale nei settori in cui l'importo della sanzione pecuniaria è spesso legato alla durata della violazione.

Come funzionano le strategie di disaster recovery

Le strategie di disaster recovery più efficaci preparano le aziende ad affrontare un'ampia varietà di minacce. Un modello efficace per il ripristino delle normali operazioni può aiutare a rafforzare la fiducia degli investitori e dei clienti e aumentare la probabilità di ripresa da qualsiasi minaccia che le aziende devono affrontare. Prima di entrare nel merito dei componenti effettivi delle strategie di disaster recovery, esaminiamo alcuni termini chiave.

  • Failover/failback: il failover è un processo ampiamente utilizzato nel disaster recovery IT in cui le operazioni vengono spostate su un sistema secondario quando uno principale si guasta a causa di un'interruzione di corrente, un attacco informatico o altra minaccia. Il failback è il processo di ritorno al sistema originale una volta ripristinati i normali processi. Ad esempio, un'azienda potrebbe eseguire il failover dal suo data center su un sito secondario in cui un sistema ridondante si attiverà istantaneamente. Se eseguito correttamente, il failover/failback può creare un'esperienza senza interruzioni in cui un utente/cliente non si renderà nemmeno conto di essere stato trasferito su un sistema secondario.
  • Recovery Time Objective (RTO): l'RTO si riferisce alla quantità di tempo necessaria per ripristinare le operazioni aziendali dopo un incidente imprevisto. Stabilire un RTO ragionevole è una delle prime cose che le aziende devono fare quando stanno creando la loro strategia di disaster recovery.
  • Recovery point objective (RPO): l' RPO delle aziende è la quantità di dati che queste possono permettersi di perdere e di recuperare. Alcune aziende copiano costantemente i dati su un data center remoto per garantire la continuità. Altre stabiliscono un RPO tollerabile di pochi minuti (o addirittura ore) e sanno che saranno in grado di recuperare tutto ciò che è andato perso in quel lasso di tempo.
  • Disaster Recovery-as-a-Service (DRaaS): ilDRaaS è un approccio al disaster recovery che sta guadagnando popolarità grazie alla crescente consapevolezza dell'importanza della sicurezza dei dati. Le aziende che adottano un approccio DRaaS al disaster recovery stanno essenzialmente esternalizzando i loro piani di disaster recovery (DRP) a terzi. Questa terza parte ospita e gestisce l'infrastruttura necessaria per il ripristino, quindi crea e gestisce i piani di risposta e garantisce una rapida ripresa delle operazioni business-critical. Secondo un recente rapporto di Global Market Insights (GMI) (link esterno a ibm.com), il mercato del DRaaS nel 2022 valeva 11,5 miliardi di dollari con una prospettiva di crescita del 22% negli anni a venire.

Cinque passaggi per creare una solida strategia di disaster recovery

La pianificazione del disaster recovery inizia con un'analisi approfondita dei processi aziendali più critici, nota come analisi dell'impatto aziendale (BIA) e valutazione del rischio (RA). Sebbene ogni azienda sia diversa e abbia requisiti unici, ci sono diverse misure che può adottare, indipendentemente dalle dimensioni o dal settore in cui opera, che contribuiranno a garantire una pianificazione del disaster recovery efficace.

Fase 1: Eseguire un'analisi dell'impatto aziendale

L'analisi dell'impatto aziendale (BIA) è un'attenta valutazione di ogni minaccia che l'azienda deve affrontare, insieme ai possibili esiti. Una BIA forte esamina come le minacce potrebbero influire sulle operazioni quotidiane, sui canali di comunicazione, sulla sicurezza dei lavoratori e su altre parti critiche dell'attività. Esempi di alcuni fattori da considerare quando si effettua la BIA sono la perdita di fatturato, la durata e il costo del tempo di inattività, il costo del recupero della reputazione (relazioni pubbliche), la perdita di fiducia dei clienti o degli investitori (a breve e a lungo termine) e le eventuali sanzioni da sostenere a causa delle violazioni della conformità causate da un'interruzione.

Fase 2: Eseguire un'analisi dei rischi

Le minacce variano notevolmente a seconda del settore e del tipo di attività che gestisci. Condurre un'accurata analisi del rischio (RA) è un passaggio fondamentale nel definire la tua strategia. Puoi valutare separatamente ogni potenziale minaccia considerando due fattori: la probabilità che si verifichi e l'impatto potenziale sulle operazioni aziendali. A tale scopo esistono due metodi ampiamente utilizzati: analisi qualitativa e analisi quantitativa del rischio. L'analisi qualitativa del rischio si basa sul rischio percepito, mentre l'analisi quantitativa viene eseguita utilizzando dati verificabili.

Fase 3: Creare un inventario degli asset

Il disaster recovery si basa sull'avere un quadro completo di tutti gli asset che l'azienda possiede. Questo include l'hardware, il software, l'infrastruttura IT, i dati e tutto ciò che è critico per le operazioni aziendali. Ecco tre etichette ampiamente utilizzate per categorizzare gli asset:

  • Critici: gli asset critici sono soltanto quelli necessari per le normali operazioni aziendali.
  • Importanti: si tratta di asset che l'azienda utilizza almeno una volta al giorno e che, in caso di interruzione, avrebbero un impatto sulle operazioni aziendali (ma non le bloccherebbe completamente).
  • Non importanti: si tratta di asset che l'azienda utilizza di rado e che non sono essenziali per le normali operazioni aziendali.

Fase 4: Assegnare ruoli e responsabilità 

L'assegnazione chiara di ruoli e responsabilità è probabilmente la parte più importante di una strategia di disaster recovery. Senza di essa, nessuno saprà cosa fare in caso di disastro. Sebbene i ruoli e le responsabilità effettivi varino notevolmente a seconda delle dimensioni dell'azienda, del settore e del tipo di attività, ci sono alcuni ruoli e responsabilità che ogni strategia di recovery dovrebbe prevedere:

  • Segnalatore di incidenti: è responsabile della comunicazione con gli stakeholder e le autorità competenti quando si verificano eventi dirompenti e del mantenimento delle informazioni di contatto aggiornate per tutte le parti interessate.
  • Responsabile del piano di disaster recovery: il responsabile DRP si assicura che i membri del team di disaster recovery eseguano le attività loro assegnate e che la strategia messa in atto funzioni senza intoppi. 
  • Asset manager: è consigliabile assegnare a qualcuno il compito di mettere in sicurezza e proteggere gli asset critici in caso di disastro e di riferire sul loro stato durante l'incidente.

Fase 5: Test e perfezionamento

Affinché la strategia di disaster recovery sia valida, bisognerà praticarla costantemente e aggiornarla regolarmente in base a eventuali modifiche significative. Ad esempio, se l'azienda acquisisce nuovi asset dopo la creazione della strategia DRP, dovranno essere inseriti nel piano per garantire che siano protetti in futuro. Il test e il perfezionamento della strategia di disaster recovery possono essere suddivisi in tre semplici passaggi:

  1. Creazione di una simulazione accurata: quando si prova il DRP, bisogna cercare di creare un ambiente il più vicino allo scenario reale che l'azienda dovrà affrontare senza mettere nessuno a rischio fisico.
  2. Identificazione dei problemi: utilizzare il processo di test DRP per identificare guasti e incongruenze con il piano, semplificare i processi e risolvere eventuali problemi con le procedure di backup.
  3. Prova delle procedure di disaster recovery: verificare la risposta a un incidente è fondamentale, ma è altrettanto importante testare le procedure messe in atto per ripristinare i sistemi critici una volta che l'incidente è finito. Verificare come riattivare le reti, recuperare i dati persi e riprendere le normali operazioni aziendali. 

Soluzioni di disaster recovery

Le aziende moderne si affidano più che mai alla tecnologia per servire i propri clienti. Anche piccole interruzioni possono causare tempi di inattività critici e influire sulla fiducia di clienti e investitori. IBM FlashSystem Cyber Recovery Guarantee è stata pensata per chi acquista un nuovo array FlashSystem con IBM Storage Expert Care e IBM Storage Insights Pro.

Autore

Mesh Flinders

Author, IBM Think