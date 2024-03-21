Publicado em: 21 de março de 2024
Colaboradores: Phill Powell, Ian Smalley
Um data center em hiperescala é um data center maciço que oferece recursos de extrema escalabilidade e é projetado para cargas de trabalho em grande escala com uma infraestrutura de rede otimizada, conectividade de rede simplificada e latência minimizada.
Devido à crescente demanda por armazenamento de dados, os data centers em hiperescala são amplamente utilizados em todo o mundo por inúmeros provedores e uma ampla variedade de propósitos, que incluem inteligência artificial (IA), automação, análise de dados, armazenamento de dados, processamento de dados e outras finalidades de computação de big data.
Vale a pena reservar um momento para esclarecer esses termos e quaisquer ambiguidades que eles possam apresentar. Para principiantes, os termos são frequentemente usados de forma intercambiável, o que pode criar confusão.
O termo "hiperescaladores" é frequentemente usado como um apelido para se referir a data centers de hiperescala. Infelizmente, o termo "hiperescaladores" já tem um significado estabelecido e é usado com frequência para se referir a provedores de serviços de nuvem (CSPs), como a AWS, e outras empresas que oferecem serviços de data center em hiperescala.
Como o mesmo termo pode ser usado para designar tanto um tipo de data center quanto as empresas que se especializam em computação em hiperescala e fornecem esses data centers, existe a possibilidade de confusão (por exemplo, "o hiperescalador criou o hiperescalador"). Portanto, para os fins desta página, discutiremos data centers em hiperescala e nos referiremos a provedores de serviços de nuvem (CSPs), cada um por seu termo exclusivo, evitando o termo mais genérico “hiperescalador”.
Os data centers (de todos os tamanhos) podem rastrear suas origens até o importante conceito de virtualização. A virtualização usa software para criar uma camada de abstração sobre o hardware de computador, que permite a divisão dos componentes de hardware de um único computador em várias virtual machines (VMs). Cada VM executa seu próprio sistema operacional e se comporta como um computador independente, mesmo que esteja sendo executada em apenas uma parte do hardware do computador subjacente real. Dessa forma, a virtualização permite a computação em nuvem.
Um data center em hiperescala difere dos data centers tradicionais principalmente em virtude de seu tamanho. Um data center em hiperescala exige um local físico grande o suficiente para abrigar todos os equipamentos associados, incluindo pelo menos 5.000 servidores e, possivelmente, quilômetros de equipamentos de conexão. Dessa forma, os data centers em hiperescala podem facilmente abranger milhões de metros quadrados de espaço.
A redundância é outro aspecto importante dos data centers em hiperescala e significa simplesmente fornecer medidas de backup e/ou dispositivos que possam entrar em ação automaticamente caso o equipamento falhe ou a energia seja perdida. A redundância é especialmente crítica para data centers em hiperescala, pois esses sistemas geralmente são executados automaticamente, em segundo plano, 24 horas por dia e com pouca supervisão direta.
Uma organização que deseja operar um data center em hiperescala não terá falta de decisões a tomar ao determinar o melhor curso de ação a seguir. A primeira dessas perguntas pode ser: "Devemos construir ou alugar?" Construir até mesmo um data center modesto exigirá algum nível de investimento. Construir um data center em hiperescala exige um compromisso financeiro ainda mais sério.
Muitas empresas optam por seguir outro caminho, escolhendo um data center de colocalização — um data center cujos proprietários alugam instalações e espaço em servidores para outras empresas. A vantagem deste método deve ser imediatamente aparente: alugar espaço para hardware exige um investimento significativamente menor do que construir uma estrutura inteira para abrigar equipamentos, ao menos em termos de valores pagos antecipadamente.
Comparando as duas opções básicas, fica claro que cada uma tem suas vantagens e desvantagens. A construção de um data center em hiperescala normalmente é cara e trabalhosa, mas também oferece instalações de hiperescala que são personalizadas para essa empresa, com todos os seus aspectos ajustáveis adequadamente otimizados.
Enquanto isso, alugar espaço em um data center de colocalização oferece mais opções de mobilidade e exige um investimento infinitamente menor. Mas será muito improvável que um data center de colocalização tenha sido projetado de acordo com as especificações ideais do cliente.
Algumas organizações estão buscando ainda outra opção — uma que lhes assegure que, à medida que continuam avançando, serão capazes de escalar sem ter que adquirir equipamentos de armazenamento adicionais e caros para seu sistema baseado em nuvem privada. Para muitas dessas empresas, a resposta certa envolve migrar de um sistema de propriedade privada e realocar suas operações em um ambiente de nuvem pública, como encontram com aplicativos de software como serviço (SaaS), como o Microsoft 365 ou o Google Suite.
Existem outras variações, como data centers modulares, que são instalações pré-fabricadas projetadas para uso como data centers. Os data centers modulares não são apenas pré-fabricados, mas são também pré-montados e equipados com o equipamento de resfriamento necessário. Os data centers modulares são ideais para organizações que desejam experimentar a funcionalidade do data center de forma limitada antes de fazer grandes investimentos, bem como para aquelas empresas que precisam implementar rapidamente uma solução de data center confiável.
Os data centers são usados desde a década de 1940, quando um único computador gigantesco ocupava espaços de departamentos inteiros. À medida que os computadores se tornaram mais eficientes em termos de tamanho ao longo dos anos, o espaço físico local alocado a eles também evoluiu. Então, na década de 1990, a primeira explosão de microcomputadores foi vista, reduzindo radicalmente o tamanho necessário para as operações de TI. Não demorou muito para que as "salas de servidores" passassem a ser chamadas de "data centers".
Em termos de avanços importantes, muitas vezes considera-se que o primeiro data center em hiperescala foi lançado em 2006 pelo Google em The Dalles, OR (perto de Portland). Essa instalação em hiperescala ocupa atualmente um espaço de mais de 120 mil metros quadrados e emprega uma equipe de aproximadamente 200 operadores de data center. O termo "atualmente" é utilizado porque o Google agora tem planos de expandir esse "campus de energia" com um projeto de expansão de USD 600 milhões, que adicionará um quinto prédio de aproximadamente 27.000 metros quadrados. Demonstrando seu compromisso adicional com essa tecnologia, o Google agora opera 14 instalações de data center nos EUA - bem como 6 na Europa, 3 na Ásia e 1 no Chile.
No momento, as maiores instalações de hiperescala do mundo (link externo a ibm.com) encontram-se na região da Mongólia Interior da China. É lá que a China Telecom opera um data center em hiperescala com cerca de 1 milhão de metros quadrados. Em outras palavras, o maior data center tem o tamanho de 165 campos de futebol americano oficiais, todos juntos em um espaço de 11 campos de futebol americano de largura e 15 campos de futebol americano de comprimento. Não é de surpreender que esse gigantesco data center em hiperescala (cuja construção custou US$ 3 bilhões) esteja equipado com tudo o que é necessário em termos funcionais e até mesmo possua instalações residenciais para os operadores de data center em hiperescala que trabalham lá.
Classificar as principais empresas de hiperescala pode ser problemático. Primeiro, há a questão relativamente fácil de definir quais critérios serão usados. Teoricamente, você poderia se concentrar no número de data centers em hiperescala próprios ou construídos, mas essa não é uma maneira muito precisa de julgar a entrega de serviços de nuvem de uma empresa, já que várias empresas (incluindo a Apple) alugam alguns dos data centers que usam de outros provedores de serviços.
Isso deixa apenas um meio viável de comparação: percentual de participação no mercado. Este é, em última análise, o melhor indicador de quais empresas de hiperescala estão realmente impulsionando o mercado. Mesmo que esse método seja um pouco imperfeito, porque o mercado de computação em hiperescala nunca é estático, está sempre em constante mudança.
No entanto, há muitas evidências de tendências para sugerir que um grupo de três provedores de hiperescala atualmente estabeleceu uma sólida presença no maior segmento deste mercado:
Atualmente, a AWS é a maior provedora de serviços de nuvem em hiperescala, com uma participação dominante de mercado (link fora de ibm.com) de aproximadamente 32%. A AWS opera em 32 regiões de nuvem e 102 zonas de disponibilidade, com um espaço total de 3,1 milhões de metros quadrados. A AWS é conhecida por sua experiência em automação, gerenciamento de bancos de dados e análise de dados.
A popular plataforma de hiperescala da Microsoft, o Azure, atualmente domina aproximadamente 23% (link fora de ibm.com) do mercado de hiperescala. O Azure opera em 62 regiões de nuvem, com 120 zonas de disponibilidade. Não é surpresa que o Microsoft Azure funciona especialmente bem em conjunto com o software da Microsoft para data centers corporativos.
Conhecido principalmente por sua vasta experiência em manuseio de dados, o Google Cloud controla cerca de 10% (link externo a ibm.com) do mercado de hiperescala e opera em 39 regiões de nuvem, com 118 zonas de disponibilidade. Além do manuseio e processamento de dados, o GCP atrai empresas por seus pontos fortes em inteligência artificial (IA) e análise de dados avançada.
Vários outros fornecedores estão operando nesse mesmo mercado dentro de um nível secundário de percentual de participação de mercado.
Alibaba Cloud: embora não seja tão grande quanto a AWS ou outros provedores importantes, a Alibaba possui uma forte participação de mercado de hiperescala na região Ásia-Pacífico. Suas ofertas notáveis incluem produtos relacionados à infraestrutura e serviços de IA.
Apple: a Apple usa um modelo híbrido para seus serviços de nuvem. A Apple possui oito data centers nos EUA, na Europa e na China, com planos de construir mais. Além disso, a Apple tem acordos de locação de vários anos para serviços de computação em nuvem de provedores como AWS e GCP.
IBM Cloud: há muito tempo sinônimo de expansão tecnológica, a IBM Cloud tem profunda experiência em trabalhar com data centers corporativos e prestar serviços em uma ampla variedade de áreas relacionadas. Recentemente, o trabalho pioneiro da empresa com IA está renovando sua visibilidade.
Meta Platforms: empresa responsável por plataformas on-line populares como Facebook e Instagram, a Meta Platforms opera 21 data centers em hiperescala em todo o mundo, cujo espaço total excede 4,6 milhões de metros quadrados.
Oracle Cloud Infrastructure (OCI): o OCI se posicionou como uma alternativa de menor custo à AWS, oferecendo serviços semelhantes por um preço significativamente reduzido. O OCI é excelente para permitir a criação de aplicativos nativos da nuvem e a fácil migração de cargas de trabalho de missão crítica.
O uso de energia é o problema mais importante em relação aos data centers em hiperescala. O enorme poder de computação necessário para operar data centers em hiperescala vem de uma enorme quantidade de energia elétrica. Como o aumento das criptomoedas e da mineração de bitcoin, os data centers em hiperescala representam um avanço tecnológico bastante recente, cuja demanda excepcionalmente alta por energia os posiciona, de certa forma, em conflito com as metas de sustentabilidade ecológica (apesar de algumas companhias estarem descobrindo formas de reduzir ou mesmo eliminar esses problemas).
Além dos milhares de servidores de computador sendo executados em operação constante, há também as necessidades elétricas de energia e equipamentos de rede (como transformadores e roteadores) a considerar, além de sistemas de resfriamento extremamente importantes, que impedem que o hardware atinja situações de sobrecarga térmica . E isso nem sequer começa a abordar os custos de construir e operar uma estrutura enorme para conter esse ecossistema de atividade.
É por isso que a eficiência energética é tão crucial para o funcionamento eficaz dos data centers em hiperescala. Se um servidor não estiver funcionando com eficiência máxima, isso poderá ser considerado de importância insignificante. Mas se as instalações de hiperescala contiverem milhares de servidores que não funcionam de forma eficiente, isso será considerado um problema muito maior e mais caro.
Dependendo do tamanho, os data centers em hiperescala podem exigir megawatts de energia ou até mesmo gigawatts. Há tanta variação entre os data centers em hiperescala que pode ser difícil definir uma quantidade média de uso de energia. Essas diretrizes de data centers de diferentes tamanhos não são definições oficiais, mas foram ratificadas ao longo do tempo e podem ajudar em nossa compreensão geral dessas instalações:
Micro data center: o menor data center reconhecido é geralmente usado por empresas individuais ou para escritórios remotos. Os micro data centers geralmente apresentam capacidade de 10 racks de servidores ou menos, o que equivale a uma capacidade total de aproximadamente 140 servidores. Os micro data centers normalmente ocupam um espaço de menos de 470 metros quadrados. Consumo de energia: abaixo de 100-150 kW.
Data center pequeno: normalmente, os data centers pequenos exigem um espaço de aproximadamente 470 a 1.860 metros quadrados e podem acomodar de 500 a 2.000 servidores. Consumo de energia: 1-5 MW.
Data center médio: os data centers médio locais normalmente tem entre 2.000 e 5.000 servidores. Da mesma forma, sua metragem quadrada pode variar entre aproximadamente 1.860 e 9.300 metros quadrados.Consumo de energia: cerca de 100 MW.
Data centers em hiperescala: a definição da IDC de um hiperescalador (link externo a ibm.com) afirma que, para ser considerado um data center em hiperescala verdadeiro, a instalação deve conter pelo menos 5.000 servidores e ocupar um espaço físico de pelo menos 930 metros quadrados, aproximadamente. Consumo de energia: acima de 100 MW.
As enormes necessidades de energia exigidas pelos problemas de dados em hiperescala representam um quebra-cabeça geográfico para as empresas que desejam investir pesadamente nesse tipo de infraestrutura.
A energia é mais cara dependendo de sua localização, e as empresas frequentemente procuram países subdesenvolvidos ou áreas regionais como locais potenciais para a construção de seus data centers em hiperescala porque a precificação da eletricidade é mais atrativa nessas economias.
Mas esse é apenas um critério a ser considerado. Encontrar uma área com uma fonte de energia acessível é crucial, assim como observar a sustentabilidade local. Mas também encontrar um local que provavelmente não estará sujeito a situações climáticas constantes e perigosas, que possam colocar em risco as funções de missão crítica de uma empresa, devido a de cortes de energia e downtime.
As empresas estão tentando equilibrar suas iniciativas corporativas com metas de sustentabilidade, para que os data centers em hiperescala sejam acessíveis para operar e deixem a menor pegada de carbono possível. O esforço para reduzir o uso de energia está até mesmo levando empresas a buscar soluções de energia renovável para alimentar seus data centers em hiperescala. A maioria das grandes empresas envolvidas em computação em hiperescala já investigou ou está explorando opções de energia renovável, como energia solar e eólica, como uma maneira de compensar seu considerável consumo de energia.
Em alguns casos, provedores de serviços em nuvem até se comprometeram a garantir que seus data centers ofereçam sustentabilidade completa. O mais impressionante é a Apple (link fora de ibm.com), que desde 2014 apoia a sustentabilidade com ações construtivas reais. Foi quando a empresa determinou que todos os seus data centers fossem alimentados completamente por energia renovável. Há uma década, os data centers da Apple — todos eles — têm sido operados com várias combinações de células de combustível de biogás, hidroeletricidade, energia solar e energia eólica.
A explosão de dados não dá sinais de que vá parar ou mesmo diminuir. Na verdade, há muitas evidências que sugerem que ainda está apenas começando a crescer.
Nunca houve um momento em que tanta quantidade de dados foi produzida, registrada e estudada. A tecnologia alcançou um marco onde até mesmo dispositivos simples são tão inteligentemente projetados que muitos deles geram dados de forma independente e os transmitem para fins de arquivamento e análise, através da internet das coisas (IoT).
O think tank Synergy Research Group (que fornece pesquisa quantitativa e inteligência de mercado) anunciou descobertas em outubro de 2023 mostrando que os avanços da IA ajudarão a aumentar a capacidade dos data centers em hiperescala e que, até 2028, a capacidade média de data centers em hiperescala (link fora ibm.com) mais do que triplicará.
A criação de data centers em hiperescala estimula outros setores, como o de manufatura (considere os milhares de racks de servidores que devem ser forjados). Outro setor é o imobiliário, onde enormes terrenos não desenvolvidos são comprados e vendidos para uso dessas instalações enormes. O setor da construção civil também se beneficia.
Um relatório da Newmark de 2024 (link fora de ibm.com) analisou uma situação atual que afeta o mercado dos EUA — o maior consumidor mundial de data centers e data centers em hiperescala. A Newmark descobriu que a demanda por novos data centers nos EUA excede em muito os níveis atuais de capacidade, especialmente nas principais cidades dos EUA e nos arredores.
Os saltos tecnológicos introduzidos pela IA e pelo aprendizado de máquina exigirão quantidades cada vez maiores de eletricidade. No mesmo relatório de 2024, a Newmark projetou que a energia necessária para data centers em 2030 (link fora de ibm.com) quase dobrará, em comparação com seu nível de 17 MW em 2022. A Newmark espera que o uso total dos data centers atinja 35 GW.
Descubra a maneira mais fácil de implementar o IBM Storage Scale com desempenho e capacidade que variam de um a mais de 1.000 nós.
Atualize sua infraestrutura de armazenamento com switches SAN tipo B e tipo C da IBM e reduza seu custo total de propriedade.
Acelere sua adoção da plataforma IBM Cloud com um acelerador compatível com uma ampla variedade de aplicativos e zonas de destino.
Equilibre ambos os lados da equação de armazenamento de dados usando o software da IBM (como o IBM FlashSystem) e as soluções de hardware da IBM.
Os data centers em hiperescala estão levando o conceito de armazenamento a novos níveis de produtividade, e estão se provando como poderosos aliados para aplicações de IA e aprendizado de máquina. Descubra como aproveitar melhor esses novos e poderosos recursos em sua empresa com o IBM Storage Scale.