Início
topics
hiperescala
Publicado em: 12 de março de 2024
Colaboradores: Phill Powell, Ian Smalley
A hiperescala é uma arquitetura e Distributed Computing Environment projetada para oferecer escalabilidade extrema para acomodar cargas de trabalho de escala maciça. O termo relacionado "hiperescalador" refere-se a data centers em hiperescala, que são significativamente maiores do que os data centers tradicionais no local.
Como é óbvio para quem trabalha com TI, existem atividades rotineiras e também projetos cujo tamanho excede em muito o usual. Esses casos de grandes dimensões exigem um manejo extra e uma noção ampliada de proporção. Resumindo, eles precisam das habilidades especiais habilitadas pela computação em hiperescala.
A computação em hiperescala é a contrapartida do uso de data centers corporativos padrão. Na computação em hiperescala, as empresas criam ou ajudam a criar bancos de dados grandes e quase infinitamente escaláveis.
Leia uma visão geral da estratégia da IBM para ajudar a acelerar a modernização de aplicações de mainframe com IBM zSystems e nuvem híbrida.
As tecnologias de hiperescala representam uma mudança radical na forma como o fluxo diário e o volume de dados gerados pelas empresas podem ser processados.
Pode ser difícil lembrar, mas houve um tempo em que todo o data center de uma empresa poderia ser executado a partir de um único servidor dentro de um gabinete de escritório.
Então, surgiram os hipervisores, cujo uso como camadas de abstração permite que aplicativos em Virtual Machines (VMs) sejam transferidos de uma instalação física para outra, um momento crucial no avanço dos data centers de hiperescala.
Na maioria dos casos, os data centers locais originais de antigamente simplesmente não conseguem lidar com o volume de dados gerado atualmente, especialmente aqueles criados por aplicações hiperescaladas.
Os data centers em hiperescala (também chamados de hiperescaladores) ocupam um espaço físico consideravelmente maior do que os data centers locais tradicionais, que tendem a ser dimensionados em algum lugar na faixa de 930 metros quadrados.
De acordo com a definição de hiperescalador da IDC, para ser considerada um verdadeiro hiperescalador, uma empresa deve usar 5.000 servidores ou mais e dedicar pelo menos 930 metros quadrados à operação.
A instalações em hiperescala frequentemente são múltiplas disso, com tamanhos de prédios muitas vezes chegando a dimensões que se aproximam de 5.600 metros quadrados, aproximadamente o tamanho de um campo de futebol americano oficial dos EUA.
E, embora esse possa ser um tamanho típico de hiperescala, não é nem de longe o maior exemplo de opções de armazenamento. Essa distinção pertence ao grande data center da China Telecom localizado em Horinger, Hohhot, na região da Mongólia Interna chinesa. Essa instalação, que custou USD 3 bilhões para ser construída, cobre impressionantes um milhão de metros quadrados e usa 150 megawatts de energia. (Para visualizar uma instalação dessa enormidade, tente imaginar o espaço combinado de aproximadamente 165 campos de futebol americano adjacentes.)
Os hiperescaladores, uma consequência da computação em hiperescala, são data centers em hiperescala usados principalmente para fornecer e gerenciar aplicações de grande porte.
Os hiperescaladores são basicamente similares aos data centers tradicionais, porém projetados para uma escala muito superior aos data centers locais usuais. Eles conseguem isso ao construir e operar uma infraestrutura de hardware e software enorme nas instalações dos hiperescaladores. Milhões de servidores distribuídos por diversos data centers oferecem recursos de armazenamento e computação aparentemente ilimitados.
Como o tráfego de dados pode flutuar enormemente, especialmente ao executar aplicações enormes, os hiperescaladores acomodam esse tráfego e estabilizam as operações de hiperescala quando há maior demanda em um ambiente de computação. Os hiperescaladores fazem isso servindo essencialmente como uma forma de balanceador de carga, fazendo malabarismos com tarefas e redirecionando recursos de computação conforme a necessidade.
Algumas empresas não estão realmente preparadas para aproveitar a tecnologia de hiperescala, devido ao custo de entrada e outros custos associados. No entanto, para a maioria dos negócios, os benefícios superam significativamente esses custos.
A virtualização permite a computação em nuvem, e os CSPs hospedam data centers em hiperescala para acomodar os muitos usos da computação em nuvem e os dados que ela gera. Entretanto, o usuário está livre dos muitos detalhes e dores de cabeça operacionais ocasionais de executar um data center local e, em vez disso, interage com os recursos de nuvem necessários por meio de interfaces de programação de aplicativos (APIs).
A infraestrutura de hiperescala, que sustenta o computador de hiperescala, promove tanto alto desempenho quanto redundância, tornando os projetos de hiperescala a escolha ideal para atividades de computação em nuvem e processamento de grandes volumes de dados.
Por ter sido construída expressamente para lidar com eficiência com propósitos de hiperescala, a infraestrutura de hiperescala é capaz de aumentar a relação custo-benefício da operação, mesmo ao lidar com cargas de trabalho gigantescas.
Não adianta construir o que é essencialmente uma fazenda de servidores, a menos que os servidores tenham uma conectividade robusta e extremamente rápida (com baixa latência), para que esses servidores possam se comunicar de maneira eficaz entre si. Os hiperescaladores fornecem isso.
Atualmente, o mercado de hiperescala é dominado pelos "cinco grandes" provedores de nuvem pública, com cada um desses provedores de serviços em nuvem (CSP) possuindo seus próprios pontos fortes.
No 1.º trimestre de 2023, a AWS obteve uma participação de mercado de 32%, tornando-a o maior provedor de serviços de nuvem em hiperescala. Seus produtos temáticos na nuvem se concentram em aspectos como opções de armazenamento, poder de computação, automação, bancos de dados e análise de dados.
Muitas empresas já são consumidoras de algum produto da Microsoft, portanto, esses negócios podem ter um nível de conforto estabelecido com a empresa e suas ofertas. Isso inclui o software corporativo da Microsoft, que se integra bem ao Microsoft Azure, seu produto de hiperescala. (Participação de mercado: 23%)
O Google atingiu o poder e a proeminência que possui por meio de seu domínio sobre o manuseio de dados, e as empresas ainda buscam o GCP (cerca de 10% do mercado), especialmente se essas empresas estão ansiosas para se engajar em análise de dados avançada e ampliar sua presença em inteligência artificial (IA).
Possuindo um histórico consolidado em tecnologia, o IBM Cloud utiliza o conhecimento da empresa em diversas áreas, incluindo IA e administração de data centers empresariais. A IBM Cloud oferece serviços abrangentes para Infraestrutura como serviço (IaaS), Plataforma como serviço (PaaS) e Software como serviço (SaaS).
As vantagens do OCI incluem a facilidade de migrar cargas de trabalho empresariais críticas e a capacidade de construir aplicativos nativos da nuvem. Outro ponto de venda para o OCI tem sido sua política de preços agressivamente baixa, com a Oracle alegando oferecer os mesmos serviços básicos que a AWS por uma fração do custo.
O resumo rápido da visão geral sugere que a AWS se destaca por seu acesso global e escalabilidade avançada. O GCP é atrativo para empresas que necessitam de gerenciamento de dados de alto nível e desejam explorar recursos como aprendizado de máquina, e o Azure da Microsoft oferece integração fácil de produtos e segurança aprimorada.
Além dos três principais concorrentes, o IBM Cloud está despertando considerável interesse com seu trabalho atual em IA, que influencia suas ofertas de hiperescala. E a Oracle tem servido a OCI como uma plataforma criada para economizar dinheiro e hospedar aplicações nativas em nuvem.
Como é evidente, cada um desses provedores difere significativamente em sua abordagem e áreas específicas de especialização, mas eles compartilham semelhanças. Por exemplo, os três principais desses provedores agora oferecem serviços nativos da nuvem que tem suporte para protocolos de acesso a redes zero trust (ZTNA), projetados para oferecer uma alternativa às VPNs, que podem apresentar vulnerabilidades de segurança.
Diferentes empresas abordam como negociam suas necessidades de hiperescala com estratégias diferentes.
Nem todas as empresas podem arcar com os investimentos financeiros substanciais necessários para criar hiperescaladores elaborados ou desejam assumir tal compromisso financeiro. Lembre-se, não estamos falando simplesmente de custos de construção. Também há compras maciças de equipamentos a serem consideradas.
Também foi observado que algumas instalações de hiperescala consomem mais energia do que pequenas cidades. Assim, os custos com eletricidade e as preocupações ambientais geralmente também devem ser considerados na estratégia da empresa sobre o uso de hiperescaladores.
Como alternativa à compra de equipamentos, algumas empresas ainda se envolvem na prática de colocalização, na qual servidores ou outros equipamentos de computação são alugados.
Os hiperescaladores também causaram impacto quando se trata de dispositivos da Internet das coisas (IoT) e de como são gerenciados. O fato de as nuvens de hiperescala estarem sendo usadas em conjunto com equipamentos preexistentes (em muitos casos) ajuda a reduzir o preço dos investimentos em infraestrutura para o ecossistema de IoT, tornando-o mais vantajoso para as empresas.
Descubra a maneira mais fácil de implementar o IBM Storage Scale com desempenho e capacidade que variam de um a mais de 1.000 nós.
Atualize sua infraestrutura de armazenamento com switches SAN IBM tipo b e tipo c e reduza seu custo total de propriedade.
Acelere sua adoção da plataforma IBM Cloud com um Acelerador compatível com uma ampla variedade de aplicativos e zonas de destino.
Equilibre ambos os lados da equação de armazenamento de dados usando o software da IBM (como o IBM FlashSystem) e as soluções de hardware da IBM.
Uma rede de área de armazenamento (SAN) é uma rede dedicada que é adaptada a um ambiente específico, combinando servidores, sistemas de armazenamento, switches de rede, softwares e serviços.
Um data center é uma sala, prédio ou instalação física que abriga infraestrutura de TI para construir, executar e fornecer aplicações e serviços, e para armazenar e gerenciar os dados associados a essas aplicações e serviços.
O armazenamento de objetos é uma arquitetura de armazenamento de dados ideal para armazenar, arquivar, fazer backup e gerenciar grandes volumes de dados estáticos não estruturados de forma confiável, eficiente e acessível.
O armazenamento de dados refere-se a mídias magnéticas, ópticas ou mecânicas que gravam e preservam informações digitais para operações contínuas ou futuras.
A infraestrutura de TI refere-se aos componentes combinados necessários para a operação e o gerenciamento de serviços de TI corporativos e ambientes de TI.
Latência é uma medida de atraso em um sistema. A latência de rede é a quantidade de tempo que leva para os dados viajarem de um ponto a outro através de uma rede.