O RTO (Objetivo de Tempo de Recuperação) explicado

Por IBM Services

O que é um RTO (Objetivo de Tempo de Recuperação)?

O RTO representa o intervalo de tempo que um aplicativo pode ficar inativo e sem resultar em danos significativos a um negócio e o tempo que leva para o sistema sair do estado de perda para a recuperação. Este processo de recuperação inclui as etapas que a TI deve adotar para devolver o aplicativo e seus dados ao seu estado pré-desastre. Para aplicativos de alta prioridade, um RTO pode certamente levar alguns segundos, desde que o departamento de TI tenha investido em serviços de failover. Os RTOs exigem que seu departamento de TI primeiro classifique os aplicativos com base em sua prioridade e no risco de causar perdas para os negócios. Em seguida, aloca a quantia adequada de recursos de sua empresa para estes aplicativos, como tempo, dinheiro e infraestrutura de TI.

Determinando um RTO

O RTOs são usados para medir o tempo necessário para o departamento de TI recuperar os dados após o desastre. Para sua avaliação, os RTOs representam as necessidades gerais do seu negócio e determinam quanto tempo seu negócio consegue sobreviver sem a infraestrutura e os serviços de TI. Os RTOs primeiro precisam estar alinhados com os recursos disponíveis do seu departamento de TI. Os administradores de TI precisam ter um amplo conhecimento sobre as diferentes velocidades de restauração para calcular um RTO que atende às necessidades dos negócios. Por exemplo, não é possível obter um RTO de uma hora se o tempo mínimo de restauração é de duas horas.

Como o processo envolve a restauração de todas as operações de TI, os RTOs muitas se tornam difíceis de serem obtidos. Seu departamento de TI pode agilizar parte do processo de recuperação, automatizando o máximo possível. O RTO pode apresentar custos maiores do que o de um RPO granular, e um RTO de alta demanda envolve toda a sua infraestrutura de negócios e não apenas os dados. O custo de obtenção de um RTO ou RPO deve estar alinhado com a priorização do seu departamento de TI em relação a aplicativos e dados. A área de TI prioriza aplicativos e dados com base em receita e risco. Se os dados de um aplicativo cumprem com as regulamentações, então a perda de dados desse aplicativo poderá resultar em multas altas independentemente de quantas vezes esse aplicativo for usado.

Obtendo um RTO ou RPO quase nulo

Enquanto os RTOs e RPOs variam em relação à prioridade de aplicativos e dados, é altamente custoso para qualquer empresa entregar um RTO ou RPO quase nulo para todos os seus aplicativos. Um tempo de atividade de 100% para o RTO e nenhuma perda de dados para RPO podem ser alcançados somente investindo em replicação de dados contínuos e ambientes virtuais.

Exemplo de um RTO

A recuperação de item granular é um exemplo de RTO. Por este exemplo, um usuário em uma empresa ocupada exclui um e-mail importante e esvazia a pasta de lixo. Esta empresa usa o Microsoft Exchange como um aplicativo crítico de negócios e seu departamento de TI oferece suporte contínuo para trocas de nível delta no Exchange com um aplicativo de backup que oferece recursos de backup e recuperação granular. Este recurso permite que o departamento de TI recupere rapidamente um e-mail importante em cerca de cinco minutos em vez de restaurar uma máquina virtual completa para obter apenas um e-mail.

O que é um objetivo de tempo de recuperação (RTO) e como ele afeta a recuperação de desastres da sua empresa?

Recuperação de desastres e um RTO

Quedas de energia. Roubo. Servidores corrompidos e discos rígidos. Ciberataques e ransomware. Tornados, terremotos e furacões. Existem muitos tipos diferentes de desastres que podem causar danos em seu negócio se você não estiver preparado para eles. Como esses desastres são muitas vezes inevitáveis, ter uma infraestrutura de TI forte e estabelecer tempos e objetivos de pontos de recuperação regulares é essencial para fortalecer seu esquema de recuperação. É possível que seu departamento de TI faça um failover de um aplicativo e replique seus dados para obter uma perda quase nula, no entanto, fazê-lo requer recursos substanciais. Seu departamento de TI precisa estabelecer um RTO com base na sua prioridade de aplicativos e no orçamento e recursos alocados para eles.

O que é um RPO e qual a diferença em relação aos RTOs?

Os RTOs são semelhantes aos objetivos de ponto de recuperação (RPOs), pois fazem uma medição de tempo a partir da falha, desastre ou evento causador de perda semelhante. Os RPOs calculam um ponto no tempo quando seus dados foram utilizáveis pela última vez, provavelmente o backup mais recente. Os RPOs e RTOs são conceitos fundamentais para a continuidade dos negócios e são métricas de negócios necessárias para determinar com que frequência sua empresa deve planejar seus backups de dados.

Orquestração de resiliência e recuperação de desastres

Há muitos desafios para uma estratégia de recuperação de desastres, especialmente para uma recuperação de desastres de ambiente de TI híbrida. Estes desafios, entre outros, incluem:

  • Cargas de trabalho implementadas em diferentes ambientes
  • Interdependências entre infraestrutura de TI e aplicativos
  • Reconectar todos os dispositivos, componentes e aplicativos de volta para o RPO e restaurar a capacidade total da operação da empresa
  • A restauração do sistema pode ser prolongada por meio da recuperação de sistemas e aplicativos na ordem incorreta.

O que pode ser feito para desenvolver e entregar uma estratégia bem-sucedida de recuperação de desastres apesar de cada obstáculo? A recuperação de alguns aplicativos críticos em poucas horas é normalmente possível com a equipe de TI certa, mas requer muitos recursos valiosos. As demandas de hoje são para maiores RTOs e RPOs e para uma recuperação de sistema onde diversos aplicativos de missão crítica são rapidamente restaurados. Agora é possível minimizar o impacto da disrupção e realizar uma recuperação de uma indisponibilidade dentro de minutos. A automação é fundamental, pois cria programas de recuperação de desastres em escala automatizando os fluxos de trabalho entre diferentes aplicativos de forma rápida e confiável através de uma transição para ambientes híbridos.

A tecnologia atual de orquestração de resiliência permite implementar com sucesso sua estratégia de recuperação de desastres e reduzir a demanda por redução do tempo de inatividade da produção e a vulnerabilidade dos negócios como resultado de interrupções. Em termos de orquestração de resiliência e preparação, ajuda as organizações a realizar testes de recuperação de desastres com sucesso e equipes reduzidas. A orquestração de resiliência também ajuda essas organizações a reduzir a necessidade de validação e preparação de simulações para recuperação de desastres. Uma das principais vantagens da tecnologia de orquestração de resiliência é sua capacidade de funcionar em ambientes físicos, virtuais e na cloud, além de apoiar o reconhecimento do aplicativo. Como o autoatendimento e os baixos parâmetros de acordos de nível de serviço cada vez mais fazem parte expectativas dos usuários finais para os serviços de cloud, as estratégias de resiliência com base em orquestração estão se tornando mais importantes para as empresas modernas que buscam adotar ambientes de cloud.