Alta disponibilidade versus tolerância a falhas
A diferença entre tolerância a falhas e alta disponibilidade, é esta: Um ambiente tolerante a falhas não possui interrupção de serviço, mas possui um custo significativamente mais alto, enquanto um ambiente altamente disponível possui um mínimo de interrupção de serviço.
A tolerância a falhas baseia-se em hardware especializado para detectar uma falha de hardware e alternar instantaneamente para um componente de hardware redundante, seja o componente com falha um processador, uma placa de memória, uma fonte de alimentação, um subsistema de E/S ou um subsistema de armazenamento. Embora essa transição seja aparentemente fácil e ofereça serviço sem interrupção, um valor elevado é gasto para cobrir os custos de hardware e desempenho, porque os componentes redundantes não executam processamento. Mais importante ainda, o modelo tolerante a falhas não abrange falhas de software, que são, de longe, o motivo mais comum para períodos de inatividade.
A alta disponibilidade entende disponibilidade não como uma série de componentes físicos replicados, mas como um conjunto de recursos compartilhados em todo o sistema que cooperam para assegurar os serviços essenciais. A alta disponibilidade combina software com hardware padrão de mercado para minimizar o tempo de inatividade, restaurando rapidamente os serviços essenciais quando um sistema, um componente ou um aplicativo falha. Embora não seja instantâneo, os serviços são restaurados rapidamente, muitas vezes em menos de um minuto.
Muitos sites estão dispostos a absorver uma pequena quantidade de tempo de inatividade com a alta disponibilidade em vez de pagar os custos muito mais altos do fornecimento de tolerância a falhas. Além disso, na maioria das configurações altamente disponíveis, os processadores de backup estão disponíveis para uso durante a operação normal.
Os sistemas de alta disponibilidade são uma excelente solução para aplicativos que devem ser restaurados rapidamente e podem resistir a uma breve interrupção caso ocorra uma falha. Alguns segmentos de mercado possuem aplicativos que dependem tanto do tempo que não podem resistir nem mesmo a alguns segundos de tempo de inatividade. No entanto, muitos outros segmentos de mercado podem resistir a pequenos períodos de tempo em que o banco de dados fica indisponível. Para essas indústrias, PowerHA® SystemMirror® pode proporcionar a continuidade necessária do serviço sem redundância total.