Aplicações de missão crítica são aplicações que precisam funcionar para que uma empresa conduza suas operações comerciais normais. As empresas dependem de aplicações de missão crítica por vários motivos, incluindo comunicação, armazenamento de dados, entrega de bens e serviços e muito mais.
A característica principal de uma aplicação de missão crítica é o papel central que ela desempenha em permitir a operação de uma empresa. As aplicações de missão crítica são frequentemente importantes para a continuidade de negócios (a capacidade de uma organização funcionar durante e após uma crise) e recuperação de desastres (um conjunto de tecnologias e processos projetados para restaurar funções essenciais após um evento inesperado). Quando aplicações de missão crítica falham ou sofrem downtime, isso pode ameaçar as principais operações, a reputação e as fontes de receita de uma empresa.
As aplicações de missão crítica variam de setor para setor e, muitas vezes, uma aplicação de missão crítica em um setor não será designada como de missão crítica em outro. Por exemplo, uma empresa cujo negócio principal seja a resposta a emergências consideraria uma rede de comunicações que permitisse que motoristas de ambulância e despachantes se comunicassem como sendo de missão crítica. No entanto, outra empresa em outro setor pode ter uma rede de comunicação que permite que os motoristas de seus veículos de entrega se comuniquem, mas não necessariamente designaria isso como um serviço de missão crítica.
Ao designar aplicações ou cargas de trabalho de "missão crítica", as equipes de infraestrutura de TI podem ajudar a garantir que os recursos apropriados sejam dedicados às suas funções. Para aplicações menos importantes, as equipes de TI geralmente usam outro rótulo, como "crítico para os negócios" ou "baixa prioridade". Aplicações de baixa prioridade raramente são incluídas nos planos de continuidade de negócios ou planos de recuperação de desastres (DRPs), mas as aplicações críticas são.
Uma interrupção ou downtime prolongado de uma aplicação crítica para os negócios precisa representar a ameaça de sérias perdas financeiras para uma empresa, ou então as equipes de TI devem considerar designá-la como uma aplicação de baixa prioridade ou não crítica. Aplicações de baixa prioridade podem ter desempenho abaixo dos níveis de pico ou suportar longos períodos de interrupção sem prejudicar as operações de negócios ou causar perdas financeiras.
Depois de as equipes de TI identificarem com sucesso todas as aplicações de baixa prioridade, elas estarão prontas para separar as aplicações críticas de negócio das aplicações de missão crítica. Para determinar se uma aplicação deve ser considerada de missão crítica ou crítica para os negócios, pode-se aplicar um conjunto simples de critérios:
A maioria das aplicações de missão crítica tem muitos usuários que dependem delas para desempenhar funções vitais para o sucesso de uma empresa. Exemplos de atividades que aplicações de missão crítica possibilitam incluem a entrega de bens e serviços, o armazenamento seguro de dados da empresa, o rastreamento de ativos valiosos e o processamento de pagamentos de clientes. Uma interrupção em qualquer um desses processos provavelmente prejudicaria as operações normais de negócios.
As aplicações que afetam diretamente a capacidade de uma empresa de manter a continuidade de negócios, armazenar dados com segurança ou permitir a comunicação entre funcionários e clientes devem ser rotuladas como de missão crítica. Veja a seguir cada uma dessas características e como elas se aplicam em diferentes cenários.
Continuidade de negócios: a falha de uma aplicação de missão crítica deve representar um sério risco aos processos de negócios que uma empresa implementou. Exemplos comuns de como isso pode afetar uma organização incluem causar downtime significativo, afetar negativamente a segurança de clientes ou funcionários e interromper a produtividade.
Armazenamento de dados: muitas empresas, especialmente aquelas que operam em setores onde devem armazenar dados confidenciais de clientes, rotulam seus data centers como de missão crítica. Quando um data center é violado, isso pode comprometer as informações dos clientes e resultar em fraude financeira e danos à reputação 1.
Dependência do usuário: a maioria das aplicações de missão crítica é amplamente utilizada por funcionários, clientes ou uma combinação de ambos. Quando uma aplicação de missão crítica (como um aplicativo de mensagens em nuvem, como o Slack ou o iMessage) falha, os processos normais de negócios são interrompidos e podem não se recuperar por dias.
Depois que uma aplicação tiver sido identificada como de missão crítica, as equipes de TI deverão tomar as medidas apropriadas para ajudar a garantir sua disponibilidade e resiliência. Aqui estão cinco melhores práticas bem estabelecidas nas quais as empresas dependem ao projetar aplicações de missão crítica.
Devido à importância das aplicações de missão crítica para a integridade geral das organizações, elas devem ser altamente disponíveis, o que significa que clientes, funcionários e outros usuários devem ter acesso a elas perto de 100% do tempo.
Para ajudar a garantir a disponibilidade contínua, muitas empresas criam backups e redundâncias em seus BCPs e DRPs que se aplicam a aplicações de missão crítica.
É importante que as aplicações de missão crítica sejam capazes de lidar com o aumento da carga de trabalho durante os horários de pico de tráfego, ou as empresas enfrentarão possível downtime e a perspectiva de danos à reputação.
Em 2022, quando milhares de fãs de Taylor Swift tentaram comprar ingressos para sua nova turnê ao mesmo tempo, o tráfego fez com que o site ticketmaster.com parasse de funcionar, resultando em um incidente público e embaraçoso para a empresa2.
Downtime é caro, com custos médios que chegam perto de US$ 9.000 por minuto para grandes empresas e chegando a até US$ 5.000.000 por hora em setores confidenciais, como finanças e saúde3.
Empresas que criam planos sólidos de recuperação de desastres para suas aplicações de missão crítica, incluindo a implementação das soluções certas e o backup de dados confidenciais, podem reduzir significativamente sua exposição ao risco.
Uma maneira pela qual os administradores de TI podem ajudar a garantir que as aplicações de missão crítica funcionem sob condições estressantes é avaliar cuidadosamente seus requisitos técnicos e criar várias redundâncias. Uma redundância é uma duplicata estratégica de um componente crítico que pode falhar durante um evento inesperado.
Por exemplo, a redundância de dados é a prática de fazer backup de dados confidenciais em mais de um local, de modo que, se um desastre afetar um único local físico, os dados armazenados em outros lugares permaneçam seguros. Outra redundância comumente implementada é a "redundância de fonte de energia", que envolve estabelecer várias fontes de energia em potencial para sistemas de missão crítica às quais eles podem recorrer durante uma interrupção generalizada.
As migrações para a nuvem ajudam os administradores de TI a manter as aplicações de missão crítica funcionando normalmente, apesar de enfrentarem uma ampla gama de ameaças complexas. Os ambientes de nuvem privada e nuvem pública oferecem alta disponibilidade (mais de 99% de tempo de atividade para grandes provedores de serviços de nuvem (CSPs)), bem como alto desempenho, segurança e automação.
O amadurecimento da tecnologia permitiu que provedores de nuvem populares, como Amazon Web Services (AWS), IBM e Microsoft Azure, aumentassem o escopo e a complexidade de suas ofertas de nuvem. Hoje, é comum que as empresas usem a nuvem para fazer backup de dados críticos, executar instâncias de máquinas virtuais (VMs) e até hospedar aplicações críticas de missão crítica.
As aplicações que impulsionam os negócios principais de uma empresa podem variar de aplicações simples de ponto de venda (POS) usadas em lojas de varejo a aplicações de planejamento de recursos empresariais (ERP) utilizadas para aumentar a produtividade. Aqui estão alguns exemplos das aplicações de missão crítica mais amplamente utilizadas que impulsionam as empresas modernas de hoje.
Hoje em dia, todo mundo tem um aplicativo no celular que permite transferir dinheiro entre contas bancárias, fazer investimentos e até pagar contas. Enquanto os serviços bancários costumavam ser realizados presencialmente em agências locais, a maioria deles é feito online hoje.
Para as instituições financeiras que criam e mantêm essas aplicações, a falha pode resultar na perda do acesso dos clientes aos seus fundos, em fraudes de cibersegurança, em danos generalizados à reputação e muito mais. Em um setor sensível como o financeiro, até mesmo algumas horas de downtime podem gerar manchetes negativas para grandes bancos de varejo que dependem de entregar os produtos de tecnologia de ponta (fintech) aos seus clientes de maneira segura e confiável.
Os centros de armazenamento de dados são frequentemente considerados aplicações de missão crítica devido à importância das informações que armazenam e às implicações para uma empresa se essas informações forem excluídas, roubadas ou danificadas.
Os data centers de missão crítica são normalmente projetados para serem altamente disponíveis e escaláveis, com várias redundâncias e backups em vigor, às vezes até em vários locais físicos diferentes para ajudar a garantir a integridade. Ainda assim, sabe-se que as interrupções generalizadas e os ataques cibernéticos prejudicam os data centers e as informações que eles protegem, levando a interrupções nas operações de negócios e danos à reputação.
Os sistemas de comunicação, como dispositivos móveis e aplicações de mensagens em nuvem, são a base da maioria dos processos de negócios nas empresas modernas. A mudança generalizada para o trabalho remoto durante a pandemia colocou ainda mais pressão sobre o funcionamento desses sistemas. A falha dos sistemas de comunicação críticos pode resultar em resultados de perda de conectividade para a força de trabalho de uma empresa, deixando-a incapaz de se comunicar entre si ou com seus clientes.
Exemplos desse tipo de incidentes são frequentes, e todos os anos, interrupções de rede em grandes empresas de celular e software geram manchetes negativas na imprensa. Interrupções generalizadas, como o incidente CrowdStrike no início deste ano, que afetou oito milhões de usuários do Windows, podem deixar funcionários e clientes incapazes de realizar seus trabalhos ou se comunicarem por horas ou até mesmo dias4.
Sistemas de transporte modernos, como ferroviários, aéreos e rodoviários, são aplicações de missão crítica para as empresas e comunidades que dependem deles para funcionar.
Por exemplo, sistemas de controle de tráfego aéreo, grades de tráfego e metrôs, todos apresentam implicações terríveis para as populações que atendem se enfrentarem períodos de downtime. Quando esses sistemas complexos e altamente interdependentes falham, os resultados podem ser catastróficos, causando atrasos, acidentes e reparos caros. Os administradores de TI que criam e monitoram esses sistemas criam várias redundâncias e sistemas de backup em seus processos para evitar falhas e ajudar a garantir períodos de recuperação rápidos e seguros após quaisquer interrupções.
Serviços de emergência, como o envio de ambulâncias e outros recursos vitais para a segurança das comunidades, são considerados aplicações de missão crítica e devem ter uma taxa de disponibilidade próxima de 100%. Seja respondendo a um incêndio, a um acidente em uma rodovia ou ao relatório de um crime, bombeiros, polícia e prestadores de serviços de saúde devem poder confiar nas redes que lhes permitem se comunicar.
Ainda assim, os serviços de emergência podem ser afetados por problemas comuns, incluindo eventos climáticos, quedas de internet e de energia, além de períodos de demanda excepcionalmente alta pelo serviço. Os administradores de TI devem levar em consideração essas possíveis interrupções ao projetar os sistemas necessários para o funcionamento dos sistemas de missão crítica dos serviços de emergência.
