Descrizione di un RTO (Recovery Time Objective)

Di IBM Services

Cos'è un RTO (Recovery Time Objective)?

L'RTO indica quanto tempo un'applicazione può restare inattiva senza provocare danni significativi a un'azienda, incluso il tempo necessario al sistema per recuperare il tempo perduto. Questo processo di recupero comprende i passi che l'IT deve intraprendere per riportare l'applicazione e i suoi dati nello stato in cui si trovavano prima che si verificasse l'incidente. Per applicazioni ad alta priorità, un RTO può essere tranquillamente espresso in secondi, a patto che il dipartimento IT abbia investito nei servizi di failover. Per determinare gli RTO è necessario innanzitutto che il tuo dipartimento IT classifichi le applicazioni in base alla loro priorità e al rischio di perdita dell'attività. L'IT assegna a queste applicazioni la quantità adeguata di risorse dell'azienda, vale a dire tempo, denaro e infrastruttura IT.

Determinazione di un RTO

Gli RTO sono usati per misurare il tempo necessario al dipartimento IT per recuperare i dati dopo che si è verificato l'incidente. Per una valutazione iniziale, gli RTO rappresentano i bisogni complessivi del tuo business e determinano per quanto tempo il tuo business può rimanere senza l'infrastruttura e i servizi IT. Gli RTO devono essere innanzitutto allineati con le possibilità del tuo dipartimento IT. Gli amministratori IT hanno bisogno di capire bene i vari tempi di ripristino per calcolare un RTO che soddisfi le esigenze del business. Per esempio, un RTO di un'ora non può essere soddisfatto se il tempo di ripristino minimo possibile è di due ore.

Dato che il processo coinvolge il ripristino di tutte le operazioni IT, determinare gli RTO spesso è complicato. Il tuo dipartimento IT può velocizzare parte del processo di recupero automatizzando il più possibile. L'RTO può avere costi maggiori di un RPO (Recovery Point Objective) granulare; inoltre un RTO impegnativo coinvolge non solo i dati ma l'intera infrastruttura aziendale. Il costo per raggiungere un RTO o un RPO è legato alla prioritizzazione delle applicazioni e dei dati da parte del tuo dipartimento IT. L'IT fornisce la priorità alle applicazioni e ai dati in base ai ricavi e ai rischi ad essi correlati. Ad esempio, se i dati di un'applicazione sono sottoposti a normativa pubblicistica, la perdita di dati da quell'applicazione potrebbe comportare multe pesanti, indipendentemente dalla frequenza d'uso di quell'applicazione.

Come ottenere un RTO o un RPO vicino allo zero

Mentre gli RTO e gli RPO variano in relazione alla priorità delle applicazioni e dei dati, è estremamente costoso per qualsiasi impresa fornire un RTO o RPO vicino allo zero per tutte le proprie applicazioni. Un uptime del 100% per l'RTO e zero dati persi per l'RPO possono essere raggiunti solo investendo nella replica continua dei dati e negli ambienti virtuali.

Esempio di un RTO

Il recupero granulare degli elementi è un esempio di RTO. In questo esempio, un utente di un'azienda molto attiva cancella un'email importante e svuota la cartella del cestino. Questa azienda usa Microsoft Exchange come applicazione business-critical e il suo dipartimento IT esegue continuamente il backup delle modifiche a livello delta in Exchange con un'applicazione di backup che offre backup e ripristino granulari. Questa caratteristica permette al dipartimento IT di recuperare rapidamente l'email importante in circa cinque minuti anziché ripristinare un'intera macchina virtuale per una sola email.

Cos'è un RTO (Recovery Time Objective) e come influisce sul disaster recovery della tua azienda?

Disaster recovery e RTO

Interruzione di corrente. Furto. Server e hard disk corrotti. Attacchi informatici e ransomware. Tornado, terremoti e uragani. Ci sono molti tipi diversi di incidenti che possono creare problemi al tuo business se non sei preparato. Dato che questi eventi sono spesso inevitabili, avere un'infrastruttura IT forte e stabilire tempi di recupero regolari e obiettivi puntuali è essenziale per favorire il processo di recupero. Il tuo dipartimento IT può fare il failover di un'applicazione e replicare i dati per una perdita vicina allo zero, ma questo richiede risorse sostanziali. Il tuo dipartimento IT deve stabilire un RTO basato sulla priorità delle applicazioni e sul budget e le risorse assegnate.

Cos'è un RPO e quali sono le differenze con gli RTO?

Gli RTO sono in linea con gli RPO, una misura del tempo perso causato da un guasto, un incidente o un qualsiasi evento avverso che causi una perdita. Gli RPO si calcolano a posteriori tenendo conto di quando i dati sono stati utilizzabili per l'ultima volta, probabilmente il backup più recente. RPO e RTO sono concetti cruciali per la continuità del business e sono metriche di business necessarie per determinare quanto spesso la tua azienda dovrebbe programmare il backup dei suoi dati.

Orchestrazione della resilienza e disaster recovery

Ci sono molte sfide per una strategia di disaster recovery, specie nel caso di un disaster recovery in un ambiente IT ibrido. Queste sfide includono principalmente:

  • Carichi di lavoro distribuiti su ambienti diversi
  • Interdipendenze tra l'infrastruttura IT e le applicazioni
  • Riportare tutti i dispositivi, i componenti e le applicazioni all'RPO e ripristinare la piena operatività del business
  • Il ripristino del sistema potrebbe essere ulteriormente ritardato dal ripristino di sistemi e applicazioni nell'ordine non corretto.

Cosa si può fare per sviluppare e fornire una strategia di disaster recovery di successo e indipendente dal tipo di impedimento? Recuperare alcune applicazioni critiche in poche ore è generalmente possibile con il giusto team IT, ma richiede parecchie risorse preziose. Oggi sono richiesti RTO e RPO maggiori e un ripristino del sistema in cui più applicazioni mission-critical vengano ripristinate rapidamente. Ora è possibile minimizzare l'impatto dell'interruzione ed eseguire un recupero entro pochi minuti da un guasto. Gli automatismi sono cruciali, permettendo ai programmi di disaster recovery di scalare automaticamente i flussi di lavoro tra le diverse applicazioni in modo rapido e affidabile nella transizione verso ambienti ibridi.

L'odierna tecnologia di orchestrazione della resilienza ti aiuta a implementare con successo la tua strategia di disaster recovery e a ridurre sia le richieste di downtime di produzione che l'esposizione aziendale a seguito di interruzioni. In termini di preparazione, l'orchestrazione della resilienza aiuta le organizzazioni a eseguire con successo i test di disaster recovery con un minor numero di dipendenti. L'orchestrazione della resilienza aiuta anche queste organizzazioni a ridurre il tempo necessario per la preparazione e la convalida delle esercitazioni di disaster recovery. Uno dei principali vantaggi della tecnologia di orchestrazione della resilienza è la sua capacità di funzionare attraverso ambienti fisici, virtuali e cloud mantenendo la conformità delle applicazioni. Dato che i self-service e ridotti parametri di service-level rappresentano sempre più le aspettative degli utenti finali dei servizi cloud, le strategie di resilienza basate sull'orchestrazione stanno diventando sempre più cruciali per le imprese moderne che desiderano adottare ambienti cloud.