IBM Power Systems: soluções de alta disponibilidade (HA) e recuperação de desastres (DR)

By 06/03/2017

A alta disponibilidade de um datacenter é uma das características mais críticas e importantes para infraestrutura de TI, principalmente em um mundo conectado 24/7. E essa disponibilidade pode ser afetado não apenas por erros humanos, mas até por situações pouco previsíveis, como desastres naturais ou até atos terroristas.

Por isso, um bom plano de alta disponibilidade e recuperação de desastre pode ser um ponto chave para reduzir os riscos de continuação do seu negócio. Conheça nesse artigo como os ambientes IBM Power Systems oferecem soluções de alta disponibilidade e recuperação de desastre.

1 – Soluções de Alta de Disponibilidade (High Availabilty – HA)

Um sistema de alta disponibilidade é um sistema  resistente a falhas de hardware, software e energia, cujo objetivo é manter os serviços disponibilizados o máximo de tempo possível.

  • Cluster

Soluções de cluster são plataformas específicas que fornecem acompanhamento detalhado de monitoramento de software e de hardware no qual automaticamente lhe disponibiliza alta disponibilidade caso aja algum problema (failover), embora eles exigem esforço considerável para implantar e manter.

Imagem1

Em ambientes IBM Power Systems, essa solução é disponibilizada para o AIX e IBMi pelo PowerHA Standard Edition, um produto robusto que está no mercado a mais de 15 anos e com várias implementações realizadas com sucesso pelo mundo. Em ambiente Linux, o mesmo é disponibilizado por softwares de terceiros, como o TSA (IBM Tivoli System Automation). Na versão PowerHA Standard também é possível, por meio do espelhamento via AIX LVM, a configuração de cluster entre dois sites, enquanto a replicação será sincronizada pelo AIX LVM.

Imagem2

 

  • VM (Virtual Machines) Restart

VM Restart é uma plataforma capaz de reiniciar manualmente as VMs, entre outros servidores com recursos disponíveis, no exato momento que ocorrer um problema total em um servidor (Frame). Em ambiente IBM Power Systems, este recurso é disponibilizado pelo Simplified Remote Restart. Esta ferramenta já está inclusa para os modelos Power8 em diante, quando adquiridas com o PowerVM Enterprise Edition, sem a necessidade custo adicional de licença.

Imagem3

2 – Soluções de recuperação de desastre (Disaster Recovery DR)

Recuperação de desastre envolve um conjunto de políticas e procedimentos para permitir a recuperação ou continuação da infraestrutura de tecnologia e sistemas de negócios críticas na sequência de um desastre natural ou provocado pelo homem.

  • Cluster

Em ambientes Power Systems, esta solução é disponibilizada para AIX e IBMi pelo PowerHA Enterprise Edition, atuando integrado com storage, gerenciando também suas atividades e replicação para providenciar a atividade de DR em algum momento de falha.

O PowerHA IBM Storage Systems DS8800, SAN Volume Controller (SVC) V7000 e XIV com replicação IBM TotalStorage Global Mirror ou Metro Mirror (síncrona ou assíncrona), habilita automaticamente a movimentação entre sites. A versão enterprise edition também suporta replicação multi-site para storages EMC e Hitachi para AIX.

Imagem4

 

  • Geographically Dispersed Resiliency

Os ambientes IBM Power Systems agora fornecem solução de DR baseada em restart de VM. O Geographically Dispersed Resiliency GDR se integra profundamente com os ambientes PowerVM (HMC, VIOS) para fornecer a reinicialização de máquinas virtuais em sites usando imagens das VMs replicadas através do storage. A solução GDR Disaster Recovery é fácil de implantar e gerenciar. O GDR pode gerenciar a recuperação de centenas de VMs automaticamente entre sites. Disponível para VMs AIX e Linux.

Imagem5

3 – Comparando as soluções (Cluster X VM Restart)

As soluções HA-DR baseadas em cluster são melhores para proteger cargas de trabalho críticas. Por exemplo, os ambientes SAP. O HA baseado em cluster seria o melhor método para monitorar e atuar em vários componentes (software e hardware). Para outras cargas de trabalho, um modelo baseado em reinicialização VM pode ser proteção suficiente para HA e DR. A figura a seguir captura o nível de HA / proteção vs. complexidade de implementação para essas tecnologias.

Imagem6 Imagem7

4 – PowerVC ferramentas para alta disponibilidade

O PowerVC fornece virtualização e gerenciamento de Cloud em ambientes Power Systems e aproveita o OpenStack para fazer isso. O PowerVC introduziu funções de gerenciamento de alta disponibilidade em seus últimos lançamentos. Abaixo está um resumo desses recursos:

  • One-click system evacuation:

Durante as janelas de manutenção planejadas, esse recurso permite aos administradores evacuarem um servidor (Frame), ativando o Live Partition Mobility (LPM). O PowerVC organiza o LPM de todas as VMs ativas para outros servidores disponíveis no ambiente (ou um Frame de sua escolha), permitindo que a manutenção, como de firmware ou atualizações VIOS, seja realizada sem interromper as cargas de trabalho. Enquanto o Frame estiver em modo de manutenção, o PowerVC não colocará novas VMs neste host. Uma vez que a manutenção é feita, as VMs podem ser colocadas no Frame novamente e a operação normal pode ser retomada.

  • Automated remote restart

O Automated remote restart monitora os frames em caso de falha usando o serviço HA de PRS (Platform Resource Scheduler). Se um frame falhar, o PowerVC automaticamente reinicia automaticamente as máquinas virtuais do frame com falha para outro frame dentro de um grupo de hosts.

5 – Serviços de LAB Services

O time de LAB Services possui um time de consultores altamente qualificados que podem ajudar a avaliar a alta disponibilidade em seu ambiente IBM Power Systems assim como lhe ajudar a implementar a melhor solução de DR. Para saber mais, acesse o site.

[autopilot_shortcode]