Qu’est-ce qu’un centre de données IA ?

21 février 2025

 

Auteurs

Alexandra Jonker

Editorial Content Lead

Alice Gomstyn

IBM Content Contributor

Qu’est-ce qu’un centre de données IA ?

Un centre de données IA est une site qui héberge l’infrastructure informatique spécifique nécessaire pour entraîner, déployer et fournir des applications et des services d’IA. Il dispose d’architectures avancées de calcul, de réseau et de stockage et de capacités d’énergie et de refroidissement pour gérer les workloads d’IA.
 

Bien que les centres de données traditionnels contiennent bon nombre des mêmes composants qu’un centre de données IA, leur puissance de calcul et d’autres capacités d’infrastructure informatique varient considérablement. Les entreprises qui souhaitent tirer parti des avantages de la technologie de l’IA ont tout intérêt à avoir accès à l’infrastructure d’IA.

Cet accès est disponible de différentes manières et la plupart des entreprises n’auront pas besoin de créer leurs propres centres de données IA à partir de zéro, ce qui est une entreprise monumentale. Des options telles que le cloud hybride et la colocation ont réduit les contraintes associées à l’accès à l’IA afin d’en faire bénéficier des entreprises de toutes tailles.

Centres de données IA ou centres de données traditionnels

Les centres de données IA partagent de nombreux points communs avec les centres de données traditionnels. Ils disposent des mêmes types de matériel tels que des serveurs, des systèmes de stockage et des équipements réseau. Dans les deux cas, les opérateurs doivent prendre en compte des éléments tels que la sécurité, la fiabilité, la disponibilité et l’efficacité énergétique.

Les différences entre ces deux types de centres de données proviennent des exigences extraordinaires des workloads d’IA de haute intensité. Contrairement aux centres de données d’IA, les centres de données traditionnels contiennent une infrastructure qui serait rapidement submergée par les workloads de l’IA. L’infrastructure programmée pour l’IA est spécialement conçue pour le cloud, l’IA et le machine learning.

Par exemple, les centres de données conventionnels sont plus susceptibles d’accueillir des unités centrales de traitement (CPU). À l’inverse, les centres de données pour l’IA nécessitent des processeurs graphiques (GPU) à haute performance avec une infrastructure informatique adaptée, composée de capacités avancées de stockage, de mise en réseau, d’énergie et de refroidissement. Souvent, le nombre de GPU nécessaires aux cas d’utilisation de l’IA nécessite également un espace beaucoup plus important. 

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA 


La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets. 

Hyperscale ou colocation

Les termes « hyperscale » et « colocation » désignent deux types de centres de données couramment utilisés par les entreprises pour l’IA.

Hyperscale

Les centres de données hyperscale sont énormes, ils comprennent au moins 5 000 serveurs pour un espace physique de l’ordre de 900 mètres carrés. Ils offrent des capacités d’évolutivité exceptionnels et sont conçus pour les workloads à grande échelle (par exemple pour l’IA générative). Ils sont largement utilisés à l’échelle mondiale par les fournisseurs de cloud que sont Amazon Web Services (AWS), Microsoft Azure et Google Cloud Platform (GCP) pour diverses fins, notamment l’automatisation, les analyses de données, le stockage de données, le traitement des données, etc.

Colocation

Un centre de données en colocation fait référence à une situation dans laquelle une entreprise possède un centre de données hyperscale et loue ses installations, ses serveurs et sa bande passante à d’autres entreprises.

Cette configuration permet aux entreprises de profiter des avantages de l’hyperscale, sans pour autant devoir investir massivement. Certains des plus grands utilisateurs mondiaux de services de colocation sont Amazon (AWS), Google et Microsoft. Par exemple, ces fournisseurs de services cloud louent un espace important dans les centres de données à un opérateur de centres de données appelé Equinix. Ensuite, ils mettent l’espace nouvellement acquis à la disposition de clients, en le louant à d’autres entreprises.

AI Academy

La gestion des données est-elle le secret de l’IA générative ?

Découvrez pourquoi des données de haute qualité sont essentielles pour une utilisation réussie de l’IA générative.

La croissance des centres de données IA

Dans un article de blog publié en 2025, Microsoft a parlé « d’électricité de notre temps » pour évoquer l’IA. L’avenir nous dira si cette phrase restera une hyperbole ou deviendra une réalité.’ Mais on constate que l’adoption des outils d’IA tels que ChatGPT d’OpenAI par des millions d’utilisateurs non experts a évolué à un rythme électrisant. Ce potentiel évident de productivité et de monétisation des capacités d’IA a conduit à un flux important de nouveaux outils, agents et générateurs de contenu basés sur l’IA.

Les modèles open source et la démocratisation continue de l’IA signifient que les grands acteurs ne sont pas les seuls à faire des vagues dans l’écosystème de l’IA. Presque toutes les entités peuvent devenir des entreprises technologiques si elles peuvent identifier un cas d’utilisation de l’IA et adopter l’infrastructure informatique pour y parvenir. Selon un rapport publié en 2024 par l’IBM Institute for Business Value (IBM IBV), 43 % des cadres supérieurs du secteur de la technologie déclarent que leurs préoccupations concernant leur infrastructure de technologie ont augmenté au cours des six derniers mois en raison de l’IA générative, et qu’ils se concentrent désormais sur l’optimisation de leur infrastructure pour la faire évoluer.

Parallèlement, le secteur des centres de données s’est développé pour répondre à la demande. L’infrastructure des centres de données du monde entier s’adapte à l’IA et peut traiter de gros volumes de calculs et de requêtes complexes. Actuellement, les régions Asie-Pacifique et Amérique du Nord affichent la plus forte prolifération de centres de données, en particulier à Pékin, Shanghai, dans le nord de la Virginie et dans la région de San Francisco.1

Les investissements considérables des géants de la technologie ont également été le signal une croissance du secteur des centres de données d’IA. En 2025, Microsoft prévoit d’investir quelque 80 milliards de dollars dans la construction de centres de données et Meta a mobilisé 10 milliards de dollars pour le développement d’un nouveau centre de données hyperscale de plus de 370 000 mètres carrés en Louisiane.

Fonctionnalités principales d’un centre de données prêt pour l’IA

Plusieurs caractéristiques et fonctionnalités uniques sont essentielles aux centres de données dédiés à l’IA :

  • Calculs hautes performances
  • Architecture de stockage avancé
  • Mise en réseau résiliente et sécurisée
  • Solutions d’alimentation et de refroidissement adéquates

Calculs hautes performances

Un centre de données prêt pour l’IA a besoin de capacités de calcul haute performance (HPC) comparables à celles que l’on trouve dans les accélérateurs d’IA. Les accélérateurs d’IA sont des puces IA utilisées pour accélérer les modèles de ML et d’apprentissage profond (DL), le traitement automatique du langage naturel et d’autres opérations d’intelligence artificielle. Ce matériel rend possible l’IA et ses nombreuses applications

Les GPU, par exemple, sont un type d’accélérateur d’IA. Popularisés par Nvidia, les GPU sont des circuits électroniques qui décomposent les problèmes complexes en petits morceaux qui peuvent être résolus simultanément, une méthodologie connue sous le nom de traitement parallèle. Le HPC utilise un type de traitement parallèle connu sous le nom de traitement massivement parallèle, qui emploie des dizaines de milliers, voire des millions de processeurs ou de cœurs de processeur. Cette capacité rend les GPU incroyablement rapides et efficaces. Les modèles IA s’entraînent et s’exécutent sur des GPU de centres de données, alimentant de nombreuses applications IA de pointe.

 De plus en plus, les centres de données prêts pour l’IA incluent également des accélérateurs d’IA plus spécialisés, tels qu’une unité de traitement neuronal (NPU) et des unités de traitement tensoriel (TPU). Les NPU imitent les voies neuronales du cerveau humain pour un meilleur traitement des workloads d’IA en temps réel. Les TPU sont des accélérateurs qui ont été conçus sur mesure pour accélérer les calculs tensoriels dans les workloads d’IA. Leur débit élevé et leur faible latence en font la solution idéale pour de nombreuses applications d’IA et d’apprentissage profond.

Architecture de stockage avancé

La vitesse et les besoins de calcul élevés des workloads d’IA nécessitent un vaste stockage de données avec une mémoire très rapide. Les solid state drives (SSD),c’est-à-dire les périphériques de stockage à semi-conducteurs, qui utilisent généralement de la mémoire flash NAND , sont considérés comme des périphériques de stockage critiques pour les centres de données d’IA. Il s’agit plus précisément des SSD NVMe qui ont la vitesse, la programmabilité et la capacité nécessaires pour gérer le traitement parallèle.

Les GPU des centres de données, les accélérateurs et certains disques SSD utilisent également de la mémoire à haute bande passante (HBM). Ce type d’architecture mémoire permet un transfert de données à hautes performances avec une consommation d’énergie inférieure à celle de la mémoire vive dynamique (DRAM), une architecture mémoire plus traditionnelle.

Une autre facette typique de la conception des centres de données IA est l’architecture de stockage de données qui peut s’adapter aux fluctuations de la demande en données, notamment en cas de surcharges inattendues. Au lieu d’exécuter des workloads sur du matériel dédié, de nombreux centres de données (IA et conventionnels) utilisent une architecture cloud dans laquelle le stockage physique est virtualisé.

La virtualisation est la division des composants d’un seul ordinateur (tels que la mémoire et le stockage) en plusieurs machines virtuelles. Il permet une meilleure utilisation des ressources et une meilleure flexibilité en permettant aux utilisateurs d’exécuter plusieurs applications et systèmes d’exploitation sur le même matériel physique.

La virtualisation est également la technologie qui stimule les capacités du cloud hybride. Le cloud hybride garantit aux entreprises une agilité et une flexibilité accrues pour connecter les environnements cloud et sur site, une étape critique pour adopter l’IA générative à forte intensité de données.

Mise en réseau résiliente et sécurisée

L’IA doit être rapide. Les utilisateurs attendent des réponses instantanées de la part des applications d’IA en ligne et sur la route, les véhicules autonomes doivent prendre des décisions en une fraction de seconde. Par conséquent, la mise en réseau des centres de données IA doit être capable de prendre en charge les exigences de bande passante élevée des charges de travail IA avec une faible latence. Pour les centres de données à très grande échelle, les besoins en bande passante peuvent aller de plusieurs gigabits par seconde (Gbps) à plusieurs térabits par seconde (Tbps).

Pour leurs réseaux de communication externes, les centres de données traditionnels utilisent la fibre optique, mais en général, les racks des centres de données s’appuient encore sur des fils électriques en cuivre pour exécuter les communications. L’optique copackagée, un nouveau processus d’IBM Research, promet d’améliorer l’efficacité énergétique et d’augmenter la bande passante en introduisant des connexions optiques dans les appareils et les murs des centres de données utilisés pour entraîner et déployer de grands modèles de langage (LLM). Cette innovation pourrait augmenter considérablement la bande passante des communications des centres de données et accélérer ainsi le traitement de l’IA.

Presque tous les centres de données modernes utilisent des services réseau virtualisés. Cette fonctionnalité permet de créer des réseaux superposés définis par logiciel qui reposent sur l’infrastructure physique du réseau. Elle permet d’optimiser le calcul, le stockage et la mise en réseau pour chaque application et workload sans modifier l’infrastructure physique.

Les centres de données d’IA nécessitent une technologie de virtualisation de réseau de pointe misant sur l’interconnexion, l’évolutivité et la performance. Ils doivent également être en mesure de traiter les problèmes de confidentialité et de sécurité des données liés au grand volume de données utilisées pour entraîner les modèles d’IA générative.  Dans une enquête IBM IBV, 57 % des PDG affirment que les préoccupations relatives à la sécurité des données représentent un obstacle à l’adoption de l’IA.

Solutions d’alimentation et de refroidissement adéquates

La puissance de calcul, les réseaux avancés et les vastes systèmes de stockage des centres de données d’IA consomment d’énormes quantités d’électricité, tout comme les systèmes de refroidissement avancés conçus pour éviter les pannes, les temps d’arrêt et les surcharges. Goldman Sachs prévoit que l’IA entraînera une augmentation de 165 % de la demande d’électricité des centres de données d’ici 2030. Et l’analyse de McKinsey suggère que la demande mondiale annuelle en capacité de centres de données pourrait atteindre 171 à 219 gigawatts (GW). La demande actuelle est de 60 GW.

Pour répondre à ces exigences élevées en matière de consommation d’énergie et de refroidissement, certains centres de données d’IA utilisent une configuration à haute densité. Cette stratégie permet d’optimiser la superficie des centres de données grâce à des configurations de serveurs compactes plus performantes, plus économes en énergie et dotées de systèmes de refroidissement avancés.

Par exemple, le refroidissement liquide utilise souvent de l’eau plutôt que de l’air pour transférer et dissiper la chaleur. Il offre une plus grande efficacité dans la gestion de la chaleur à haute densité et une efficacité énergétique améliorée (PuE), un indicateur utilisé pour mesurer l’efficacité énergétique des centres de données. Une autre méthode de refroidissement, le confinement de refroidissement des allées chaudes et/ou froides, organise les racks de serveurs pour optimiser le flux d’air et minimiser le mélange d’air chaud et froid.

Compte tenu de ces besoins importants en énergie, les entreprises recherchent souvent un équilibre entre leurs ambitions en matière d’IA et leurs objectifs en matière de développement durable. Un exemple impressionnant est celui d’Apple, l’un des plus grands propriétaires mondiaux de centres de données hyperscale. Depuis 2014, tous les centres de données d’Apple fonctionnent entièrement à partir d’énergies renouvelables grâce à diverses combinaisons de piles à combustible au biogaz, d’ hydroélectricité, d’ énergie solaire et d’énergie éolienne.

D’autres se tournent vers des sources d’énergie extraterrestre, dans l’espoir de tirer parti de l’énergie solaire à haute intensité fournie par l’espace pour construire de nouveaux centres de données. Les avancées dans le domaine des centres de données orbitaux pourraient réduire considérablement les coûts d’énergie pour l’entraînement des modèles IA, réduisant potentiellement les dépenses d’électricité de 95 %.

Solutions connexes
Logiciels et solutions de gestion des données

Élaborez une stratégie de gestion des données qui élimine les silos, réduit la complexité et améliore la qualité des données pour offrir une expérience client et collaborateur exceptionnelle.

Découvrir les solutions de gestion des données
IBM watsonx.data

Watsonx.data vous permet d’adapter le dimensionnement des analyses et de l’IA à toutes vos données, où qu’elles se trouvent, grâce à un entrepôt de données ouvert, hybride et gouverné.

Découvrir watsonx.data
Services de conseil pour les données et les analyses

Avec IBM Consulting, exploitez les données de votre entreprise et développez une organisation basée sur les informations pour tirer des avantages métier.

Découvrir les services d’analytique
Passez à l’étape suivante

Élaborez une stratégie de gestion des données qui élimine les silos, réduit la complexité et améliore la qualité des données pour offrir une expérience client et collaborateur exceptionnelle.

Découvrir les solutions de gestion des données Découvrir watsonx.data
Notes de bas de page

1AI to drive 165% increase in data center power demand by 2030,” Goldman Sachs, 4 février 2025.