Embora os data centers tradicionais contenham muitos dos mesmos componentes de um data center de IA, seu poder computacional e outros recursos de infraestrutura de TI variam muito. Organizações que desejam capitalizar os benefícios da tecnologia de IA se beneficiariam do acesso à infraestrutura de IA necessária.
Há muitas maneiras de alcançar esse acesso e a maioria das empresas não terá que construir seus próprios data centers de IA do zero, um empreendimento extraordinário. Opções como nuvem híbrida e colocation reduziram a barreira de entrada para organizações de todos os portes poderem desfrutar do valor da IA.
Os data centers de IA têm muitas semelhanças com os data centers tradicionais. Cada um deles contém hardware como servidores, sistemas de armazenamento e equipamentos de rede. Os operadores de ambos precisam considerar aspectos como segurança, confiabilidade, disponibilidade e eficiência energética.
As diferenças entre esses dois tipos de data centers decorrem das demandas extraordinárias de cargas de trabalho de IA de alta intensidade. Ao contrário dos data centers de IA, os data centers típicos contêm uma infraestrutura que seria rapidamente sobrecarregada pelas cargas de trabalho de IA. A infraestrutura pronta para IA é especialmente projetada para as tarefas de nuvem, IA e aprendizado de máquina.
Por exemplo, é mais provável que os data centers convencionais sejam projetados para conter unidades de processamento central (CPUs). Já os data centers prontos para IA exigem unidades de processamento gráfico (GPUs) de alto desempenho e considerações de infraestrutura de TI, como recursos avançados de armazenamento, rede, energia e refrigeração. Muitas vezes, o grande número de GPUs necessárias para casos de uso de IA também exige uma metragem quadrada muito maior.
Hiperescala e colocation descrevem dois tipos de data centers comumente utilizados por organizações para IA.
Os data centers de hiperescala são enormes, com pelo menos 5 mil servidores e ocupando pelo menos mil metros quadrados em espaço físico. Eles oferecem recursos extremos de escalabilidade e são projetados para cargas de trabalho de grande escala (como IA generativa). São amplamente utilizados em todo o mundo por provedores de nuvem, como Amazon Web Services (AWS), Microsoft Azure e GooglePlataforma de nuvem (GCP) para diversos fins que incluem inteligência artificial, automação , análise de dados, armazenamento de dados , processamento de dados e outros.
Um data center de colocation se refere a uma situação em que uma empresa possui um data center de hiperescala e aluga suas instalações, servidores e largura de banda para outras empresas.
Essa configuração possibilita que as empresas aproveitem os benefícios da hiperescala sem grandes investimentos. Alguns dos maiores usuários mundiais de serviços de colocation são Amazon (AWS), Google e Microsoft. Por exemplo, esses provedores de serviços de nuvem alugam espaço significativo de data center de uma operadora de data center chamada Equinix. Em seguida, disponibilizam o espaço recém-adquirido para os clientes, alugando-o para outras empresas.
Em uma postagem de blog do início de 2025, a Microsoft chamou a IA de "eletricidade da nossa era". Ainda não se sabe se essa declaração é uma hipérbole ou se é precisa. No entanto, a adoção de ferramentas de IA como o ChatGPT da OpenAI por milhões de usuários não especialistas tem aumentado em velocidade eletrizante. Esse claro potencial de produtividade e monetização dos recursos de IA levou a um fluxo intenso de novas ferramentas de produtividade, agentes e geradores de conteúdo de IA.
Os modelos de código aberto e a democratização contínua da IA significam que não são apenas os grandes players que impulsionam o ecossistema da IA. Quase qualquer entidade pode ser uma empresa de tecnologia, se conseguir identificar um caso de uso de IA e adotar a infraestrutura de TI para fazer isso. De acordo com um relatório de 2024 do IBM Institute for Business Value (IBM IBV), 43% dos diretores de tecnologia afirmam que suas preocupações com sua infraestrutura de tecnologia aumentaram nos últimos seis meses devido à IA generativa e agora estão dedicados à otimização de suas infraestruturas para escalá-la.
Enquanto isso, o setor de data centers cresceu para atender à demanda. A infraestrutura de data center em todo o mundo está cada vez mais pronta para a IA, capaz de processar altos volumes de cálculos e solicitações complicados. Atualmente, as regiões da Ásia-Pacífico e da América do Norte têm a maior proliferação de data centers, principalmente em áreas como Pequim, Xangai, norte da Virgínia e área da Baía de São Francisco.1
Investimentos substanciais de grandes empresas de tecnologia também sinalizaram crescimento no setor de data centers de IA. Em 2025, aMicrosoft pretende investir aproximadamente 80 bilhões de dólares na construção de data centers e a Meta está investindo 10 bilhões de dólares em no desenvolvimento de um novo data center em hiperescala com um milhão de metros quadrados no estado americano da Luisiana.
Há várias características e funções exclusivas para data centers prontos para IA:
Um data center pronto para IA precisa de recursos de computação de alto desempenho (HPC), como os encontrados nos aceleradores de IA. Aceleradores de IA são chips de IA usados para acelerar modelos de ML e deep learning (DL), processamento de linguagem natural e outras operações de inteligência artificial. São amplamente considerados como o hardware que torna possível a IA e suas muitas aplicações
As GPUs, por exemplo, são um tipo de acelerador de IA. Popularizadas pela Nvidia, as GPUs são circuitos eletrônicos que dividem problemas complicados em partes menores que podem ser resolvidas simultaneamente, uma metodologia conhecida como processamento paralelo. A HPC usa um tipo de processamento paralelo conhecido como processamento massivamente paralelo, que emprega de dezenas de milhares a milhões de processadores ou núcleos de processadores. Esse recurso torna as GPUs incrivelmente rápidas e eficientes. Os modelos de IA treinam e são executados em GPUs de data centers, alimentando muitas das principais aplicações de IA.
Cada vez mais, os data centers preparados para IA também contam com aceleradores de IA mais especializados, como uma unidade de processamento neural (NPU) e unidades de processamento tensor (TPUs). As NPUs imitam as vias neurais do cérebro humano para processar melhor as cargas de trabalho da IA em tempo real. TPUs são aceleradores personalizados para acelerar os cálculos de tensores em cargas de trabalho de IA. Seu alto rendimento e baixa latência os tornam ideais para muitas aplicações de IA e deep learning .
A velocidade e as altas necessidades computacionais das cargas de trabalho de IA exigem um vasto armazenamento de dados com memória de alta velocidade. Unidades de estado sólido (SSDs) —dispositivos de armazenamento baseados em semicondutores, que normalmente utilizam memória flash NAND — são consideradas dispositivos de armazenamento críticos para data centers de IA. Especificamente os SSDs NVMe, que têm a velocidade, a capacidade de programação e a capacidade para lidarem com processamento paralelo.
GPUs, aceleradores e alguns SSDs de data center também utilizam memória de alta largura de banda (HBM). Esse tipo de arquitetura de memória possibilita a transferência de dados de alto desempenho com menor consumo de energia do que a memória dinâmica de acesso aleatório (DRAM), arquitetura de memória mais tradicional.
Outra faceta típica do design de data center de IA é a arquitetura de armazenamento de dados, que pode acomodar flutuações nas demandas de dados como picos inesperados. Em vez de executar cargas de trabalho em hardware dedicado, muitos data centers (tanto de IA quanto convencionais) utilizam uma arquitetura de nuvem onde o armazenamento físico é virtualizado.
Virtualização é a divisão dos componentes de hardware de um único computador (como memória e armazenamento) em várias máquinas virtuais. Ele possibilita o melhor uso de recursos e flexibilidade permitindo que os usuários executem vários aplicativos e sistemas operacionais no mesmo hardware físico.
A virtualização também é a tecnologia que impulsiona os recursos de nuvem híbrida. A nuvem híbrida oferece às organizações maior agilidade e flexibilidade para conectar ambientes locais e em nuvem, o que é fundamental para a adoção de IA generativa com uso intensivo de dados.
A IA deve ser rápida. Os usuários esperam respostas instantâneas de aplicativos de IA online e os veículos autônomos precisam tomar decisões em frações de segundo na estrada. Portanto a rede de data center de IA deve ser capaz de atender aos requisitos de alta largura de banda das cargas de trabalho de IA com baixa latência. Para data centers em hiperescala, os requisitos de largura de banda podem variar de vários gigabits por segundo (Gbps) a terabits por segundo (Tbps).
Os data centers tradicionais utilizam fibra óptica para suas redes de comunicação externas, mas os racks nos data centers ainda executam predominantemente comunicações com fios elétricos de cobre. Óptica em pacotes, um novo processo da IBM Research, promete melhorar a eficiência energética e aumentar a largura de banda trazendo conexões de links ópticos para dentro de dispositivos e dentro das paredes dos data centers usados para treinar e implementar grandes modelos de linguagem (LLMs). Essa inovação pode aumentar consideravelmente a largura de banda das comunicações do data center, acelerando o processamento de IA.
Quase todos os data centers modernos utilizam serviços de rede virtualizados. Esse recurso possibilita a criação de redes de sobreposição definidas por software, construídas sobre a infraestrutura física da rede. Ele possibilita a otimização de computação, armazenamento e rede para cada aplicativo e carga de trabalho sem a necessidade de fazer alterações físicas na infraestrutura.
Os data centers de IA exigem tecnologia de ponta de virtualização de rede com melhor interconexão, escalabilidade e desempenho. Deve também ser capaz de lidar com questões de privacidade de dados e segurança de dados relacionadas ao grande volume de dados utilizado para treinar modelos de IA generativa. Em uma pesquisa da IBM IBV, 57% dos CEOs afirmam que as preocupações com a segurança de dados serão uma barreira para a adoção da IA generativa.
O alto poder computacional, a rede avançada e os vastos sistemas de armazenamento dos data centers de IA exigem grandes quantidades de energia elétrica e sistemas de resfriamento avançados para evitar downtime, tempo de inatividade e sobrecarga. A Goldman Sachs prevê que a IA impulsionará um aumento de 165% na demanda de eletricidade dos data centers até 2030. E a análise da McKinsey sugere que a demanda global anual por capacidade de data centers pode atingir de 171 a 219 gigawatts (GW). A demanda atual é de 60 GW.
Para atender a esses requisitos intensos de consumo de energia e resfriamento, alguns data centers de IA empregam uma configuração de alta densidade. Essa estratégia maximiza a metragem quadrada do data center com configurações de servidor compactas que apresentam melhor desempenho, são mais eficientes energeticamente e contêm sistemas de resfriamento avançados.
Por exemplo, o resfriamento líquido geralmente utiliza água em vez de resfriamento a ar para transferir e dissipar o calor. Isso oferece maior eficiência no tratamento de calor de alta densidade e maior eficácia no uso de energia (PuE) - uma métrica utilizada para medir a eficiência energética do data center. Outro método de resfriamento, a contenção de resfriamento de corredor quente e/ou frio, organiza os racks de servidores para otimizar o fluxo de ar e minimizar a mistura de ar quente e frio.
Diante desses requisitos consideráveis de energia, as organizações atuais geralmente buscam um equilíbrio entre suas ambições de IA e as metas de sustentabilidade. Um exemplo impressionante vem da Apple, uma das maiores proprietárias de data centers em hiperescala no mundo. Desde 2014, todos os data centers da Apple funcionam totalmente com energia renovável por meio de várias combinações de células de combustível de biogás, energia hidrelétrica , energia solar e energia eólica.
Outras empresas estão buscando fontes de energia extraterrestres, na esperança de aproveitar a energia solar de alta intensidade no espaço para construir novos data centers. Avanços em data centers orbitais podem reduzir consideravelmente os custos de energia para o treinamento de modelos de IA, potencialmente reduzindo os gastos com energia em até 95%.
Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.
O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.
Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights que ofereça vantagens para os negócios.
1 “AI to drive 165% increase in data center power demand by 2030,” Goldman Sachs, 4 de fevereiro de 2025.