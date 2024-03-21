Publication : 21 mars 2024
Contributeurs : Phill Powell, Ian Smalley
Un centre de données hyperscale est un centre de données massif qui offre des capacités d'évolutivité extrême. Il est conçu pour les workloads de grande envergure avec une infrastructure réseau optimisée, une connectivité réseau rationalisée et une latence réduite.
En raison de la demande toujours croissante pour le stockage de données, les centres de données hyperscale sont largement utilisés dans le monde entier par de nombreux fournisseurs et à des fins très diverses, notamment l'intelligence artificielle (IA), l'automatisation, l'analyse de données, le stockage de données, le traitement des données et d'autres tâches de big data.
Il convient de prendre un moment pour clarifier ces termes et toute ambiguïté qu'ils peuvent présenter. Ces deux dénominations sont souvent utilisées de manière interchangeable, ce qui peut créer de la confusion.
Le terme « hyperscaler », qui est souvent utilisé pour désigner les centres de données hyperscale, possède néanmoins un autre sens bien établi : il est tout aussi souvent utilisé pour désigner les fournisseurs de services cloud (ou CSP) comme AWS et d'autres entreprises qui offrent des services de centres de données hyperscale.
Ce même terme pouvant être utilisé pour désigner à la fois un type de centre de données et les entreprises spécialisées dans l'informatique hyperscale et fournissant ces centres de données, il existe un risque de confusion. Pour plus de clarté dans cet article, nous ferons référence aux centres de données hyperscale et aux fournisseurs de services cloud (CSP) par leur terme unique et éviterons le terme plus générique d'hyperscaler.
Les centres de données (de toutes tailles) trouvent leur fondement dans un concept clé : la virtualisation. La virtualisation utilise des logiciels pour créer une couche d'abstraction sur le matériel informatique qui permet de diviser les composants matériels d'un seul ordinateur en plusieurs machines virtuelles (VM). Chaque VM exécute son propre système d'exploitation et agit comme un ordinateur indépendant, même si elle ne fonctionne que sur une partie du matériel informatique sous-jacent. C'est cela qui rend possible le cloud computing.
Un centre de données hyperscale se distingue en premier lieu des centres de données traditionnels par sa taille. Un centre de données hyperscale nécessite un site physique suffisamment grand pour héberger tous les équipements associés, y compris au moins 5 000 serveurs et (généralement) des kilomètres de connectique. Ainsi, les centres de données hyperscale peuvent facilement occuper des centaines de milliers de mètres carrés d'espace.
La redondance est un autre aspect clé des centres de données hyperscale. Elle consiste simplement à prévoir des mesures et/ou des dispositifs de secours qui peuvent se déclencher automatiquement en cas de panne d'équipement ou de coupure de courant. La redondance est particulièrement critique pour les centres de données hyperscale, car ces systèmes fonctionnent souvent automatiquement, en arrière-plan, à toute heure du jour et de la nuit, avec peu de supervision directe.
Une organisation souhaitant exploiter un centre de données hyperscale ne manquera pas de décisions à prendre pour déterminer la meilleure ligne de conduite à suivre. Il faut d'abord faire le bon choix entre construction ou location. L'élaboration d’un centre de données, même modeste, implique un certain investissement. Un centre de données hyperscale demande un engagement financier encore plus important.
De nombreuses organisations empruntent une autre voie en optant pour un centre de données en colocation. Dans ce cas, le propriétaire du centre de données loue l'infrastructure et l'espace serveur à d'autres entreprises. L'attrait de cette méthode est évident : louer un espace pour le matériel est bien moins coûteux que de bâtir la structure nécessaire pour abriter tout l'équipement, du moins en termes d'investissement initial.
Ces deux options ont chacune leurs avantages et leurs inconvénients. Bâtir un centre de données hyperscale est généralement coûteux et demande beaucoup de main-d’œuvre, mais cela permet aussi d'obtenir une installation hyperscale sur mesure pour votre entreprise, optimisée selon vos besoins.
À l'inverse, la location d’espace dans un centre de données hébergé en colocation offre plus d’options de mobilité et nécessite infiniment moins d’investissement. En revanche, il est peu probable qu’un centre de données en colocation puisse répondre en tout point à vos spécifications idéales.
Pour garantir leur évolutivité tout au long de leur croissance sans avoir à acquérir des suppléments de stockage coûteux pour leur système basé sur le cloud privé, certaines organisations se tournent vers une autre solution. Elles préfèrent migrer leurs opérations vers un environnement cloud public, en passant par des applications SaaS (Software-as-a-Service) comme Microsoft 365 ou Google Suite.
Il existe d’autres variantes, comme les centres de données modulaires, qui sont des installations préconfigurées conçues pour être utilisées comme centres de données. Les centres de données modulaires sont pré-conçus, mais ils sont en plus déjà raccordés et munis des équipements de refroidissement nécessaires. Cette option est idéale pour les entreprises qui souhaitent tester les capacités offertes par un centre de données de façon limitée avant d'engager de lourds investissements, ainsi que pour celles qui ont besoin de déployer rapidement une solution de centre de données fiable.
Les centres de données sont utilisés depuis les années 1940, époque à laquelle un seul gigantesque ordinateur remplissait des bureaux entiers. Au fil des ans, ces machines sont devenues moins encombrantes et l'espace physique sur site qui leur était dédié a également évolué. Puis, dans les années 1990, les premiers micro-ordinateurs ont vu le jour, réduisant radicalement la taille nécessaire aux opérations informatiques. Rapidement, ce qu'on appelait jusque-là des « salles de serveurs » a pris un nouveau nom : celui de centre de données.
On s'accorde à dire que le premier centre de données hyperscale a été lancé en 2006 par Google à The Dalles, dans l’Oregon, près de Portland. Cette installation hyperscale occupe actuellement 120 000 mètres carrés et emploie environ 200 opérateurs de centres de données. Nous utilisons ici le terme « actuellement », car Google a pour projet d'agrandir ce « campus énergétique » en y ajoutant un cinquième bâtiment de 27 000 mètres carrés, pour un coût de 600 millions de dollars. Preuve de son engagement en faveur de cette technologie, Google exploite désormais 14 centres de données aux États-Unis, ainsi que 6 en Europe, 3 en Asie et 1 au Chili.
À l'heure actuelle, la plus grande installation hyperscale du monde (lien externe à ibm.com) se trouve dans la région de Mongolie intérieure, en Chine. C’est là que China Telecom exploite un centre de données hyperscale de près d'un million de mètres carrés, soit l'équivalent de 165 terrains de football américain : 11 terrains de large et 15 terrains de long. Sans surprise, cet immense centre hyperscale (qui a coûté 3 milliards de dollars à construire) rassemble tout le nécessaire sur le plan fonctionnel et dispose même de résidences pour les opérateurs qui y travaillent.
Il peut être difficile de classer les principales entreprises de l’hyperscale. Premièrement, quels critères utiliser ? En théorie, vous pouvez utiliser le nombre de centres de données hyperscale détenus ou construits, mais ce n’est pas une façon tout à fait précise d’évaluer la prestation de services cloud d’un fournisseur, car beaucoup d'organisations (dont Apple) louent certains des centres de données qu’elles utilisent auprès d’autres prestataires de services.
Il ne reste donc qu’un critère de comparaison viable : la part de marché. C’est au final le meilleur indicateur du succès des entreprises de l'hyperscale, même si cette méthode est légèrement imparfaite, car le marché n’est jamais statique, mais en constante évolution.
Cependant, de nombreuses tendances suggèrent qu’un trio de fournisseurs d’hyperscale détient actuellement une solide emprise sur la majorité de ce marché :
À l'heure actuelle, AWS est le plus grand fournisseur de services cloud hyperscale, avec une part de marché (lien externe à ibm.com) d'environ 32 %. AWS opère dans 32 régions cloud et compte 102 zones de disponibilité, avec un espace total de 3 millions de mètres carrés. AWS est réputé pour son expertise en automatisation, en gestion de bases de données et en analyse de données.
Azure, la plateforme hyperscale de Microsoft, occupe actuellement environ 23 % (lien externe à ibm.com) du marché de l’hyperscale. Azure opère dans 62 régions cloud avec 120 zones de disponibilité. Sans surprise, Microsoft Azure fonctionne particulièrement bien en conjonction avec les logiciels Microsoft pour les centres de données d’entreprise.
Surtout connu à l'origine pour sa vaste expertise dans la gestion des données, Google Cloud contrôle environ 10 % (lien externe à ibm.com) du marché hyperscale et œuvre dans 39 régions cloud avec 118 zones de disponibilité. Outre la gestion des données et le traitement des données, GCP attire les entreprises avec ses capacités d'intelligence artificielle (IA) et d'analytique avancée.
De nombreux autres fournisseurs se partagent le reste de ce même marché.
Alibaba Cloud : sans faire jeu égal avec AWS et les autres principaux fournisseurs, Alibaba possède une forte part de marché hyperscale au sein de la région Asie-Pacifique. Ses offres notables comprennent des produits liés à l’infrastructure et des services d’IA.
Apple : Apple utilise un modèle hybride pour ses services cloud. Apple possède huit centres de données aux États-Unis, en Europe et en Chine, et prévoit d’en construire d’autres. En outre, Apple a conclu des baux pluriannuels pour des services de cloud computing auprès de fournisseurs comme AWS et GCP.
IBM Cloud : longtemps synonyme d'expansion technologique, IBM Cloud possède une vaste expérience en matière de collaboration avec les centres de données d'entreprise et de prestation de services dans un large éventail de domaines connexes. Ces derniers temps, le travail de pionnier de l’entreprise en matière d’IA lui apporte une visibilité renouvelée.
Meta Platforms : la société mère derrière des réseaux populaires comme Facebook et Instagram gère 21 centres de données hyperscale dans le monde, pour une superficie qui dépasse 4,5 millions de mètres carrés.
Oracle Cloud Infrastructure (OCI) : OCI se positionne comme une alternative moins coûteuse à AWS, offrant des services similaires à un prix considérablement réduit. OCI excelle dans la création d’applications cloud natives et la migration facile des workloads critiques.
La consommation d’énergie est l'enjeu le plus urgent des centres de données hyperscale. L’énorme puissance de calcul nécessaire pour les faire fonctionner demande une quantité prodigieuse d’énergie électrique. Tout comme les cryptomonnaies et le minage de bitcoins, les centres de données hyperscale, par leur appétit en énergie, sont en décalage avec les notions écologiques de développement durable (bien que certaines entreprises trouvent le moyen d'atténuer, voire d'éliminer ce problème).
Outre les milliers de serveurs informatiques qui fonctionnent en permanence, il faut également tenir compte de la consommation du matériel d'alimentation et de réseau (comme les transformateurs et les routeurs), et des systèmes de refroidissement indispensables pour empêcher la surchauffe de l'équipement. Et c'est sans compter l'impact de la création et de l’exploitation de l'énorme structure nécessaire à cette activité.
L’efficacité énergétique est donc un enjeu clé pour les centres de données hyperscale. Lorsqu'un serveur ne fonctionne pas à plein régime, l'impact est négligeable. Mais si une installation hyperscale regroupant des milliers de serveurs ne fonctionne pas efficacement, le problème est bien plus grave et plus coûteux.
Les centres de données hyperscale peuvent nécessiter des mégawatts (voire des gigawatts) de puissance, même s'il est dur de donner une consommation d’énergie moyenne en raison de la grande diversité des installations. Les directives qui suivent ne sont pas des définitions officielles, mais elles ont été officieusement ratifiées au fil du temps et vous permettront de vous faire une meilleure idée :
Micro-centre de données : les plus petits centres de données sont généralement utilisés par des entreprises individuelles ou pour des bureaux distants. Les micro-centres de données ont généralement une capacité de 10 racks de serveurs ou moins, ce qui équivaut à un total d’environ 140 serveurs. Les micro-centres de données occupent généralement moins de 45 mètres carrés d’espace. Consommation d'énergie : moins de 100 à 150 kW.
Petit centre de données : les petits centres de données nécessitent entre 450 et 2 000 mètres carrés d'espace et peuvent héberger de 500 à 2 000 serveurs. Consommation d'énergie : 1 à 5 MW.
Centre de données moyen : un centre de données sur site moyen compte généralement entre 2 000 et 5 000 serveurs. De plus, sa superficie peut varier entre 2 000 et 9 000 mètres carrés. Consommation d’énergie : environ 100 MW.
Centres de données hyperscale : selon la définition de l’IDC (lien externe à ibm.com), un véritable centre de données hyperscale doit contenir au moins 5 000 serveurs et occuper 900 mètres carrés d’espace physique au minimum. Consommation d’énergie : plus de 100 MW.
Les énormes besoins en énergie requis par les centres de données hyperscale posent un casse-tête géographique pour les entreprises souhaitant investir massivement dans ce type d’infrastructure.
Le prix de l'énergie varie selon son emplacement. Les entreprises se tournent donc souvent vers des pays ou des régions moins développés comme sites de construction potentiels pour leurs centres de données hyperscale pour des tarifs plus attractifs.
Mais ce n’est qu’un critère parmi d’autres à prendre en compte, car il est tout aussi essentiel de respecter le développement durable local. Il est également crucial de choisir un site peu sujet aux aléas climatiques qui pourraient mettre en péril les fonctions critiques d'une entreprise suite à des pannes de courant et des interruptions de service.
Les entreprises doivent concilier leurs initiatives commerciales et leurs objectifs en matière de développement durable afin de rendre l’exploitation des centres de données hyperscale abordable et limiter au maximum leur empreinte carbone. Dans cette optique, certaines privilégient des solutions d’énergie renouvelable pour alimenter leurs centres de données hyperscale. La plupart des grandes sociétés impliquées dans l’informatique hyperscale ont étudié ou sont en train d’explorer des énergies renouvelables telles que l’énergie solaire et éolienne afin de compenser leur consommation d’énergie considérable.
Dans certains cas, les fournisseurs de services cloud se sont même engagés à faire en sorte que leurs centres de données offrent une durabilité totale. Le plus impressionnant dans ce domaine est sûrement Apple (lien externe à ibm.com), qui soutient le développement durable par des actions concrètes depuis 2014, année où l’entreprise a exigé que tous ses centres soient entièrement alimentés par des énergies renouvelables. Depuis une décennie maintenant, tous les centres de données d’Apple sans exception fonctionnent avec une combinaison de biogaz, d’hydroélectricité, d’énergie solaire et d’énergie éolienne.
Le boom des données ne montre aucun signe de ralentissement. De nombreux éléments tendent même à démontrer qu’il ne fait qu’accélérer.
Dans l'histoire, il n’y a jamais eu autant de données produites, enregistrées et étudiées. La technologie a passé un cap dans la mesure où même les gadgets les plus simples sont si intelligents que beaucoup génèrent des données de façon indépendante et les transmettent à des fins d'archivage et d'analyse, via l'Internet des objets (IdO).
Le groupe de réflexion Synergy Research Group (qui produit des études quantitatives et des informations sur le marché) a annoncé en octobre 2023 que les avancées de l’IA contribueront à augmenter la capacité des centres de données hyperscale (lien externe ibm.com), qui devrait plus que tripler d'ici 2028.
La création de centres de données hyperscale stimule d'autres secteurs, tels que la fabrication industrielle (pensez aux milliers de baies de serveurs qui doivent être produites). Une autre industrie est celle de l'immobilier, où d'énormes parcelles de terrain non aménagées sont achetées et vendues pour être utilisées par ces méga-installations. Le secteur de la construction en profite également.
Un rapport de Newmark publié en 2024 (lien externe à ibm.com) analysait la situation actuelle affectant le marché américain, le plus grand consommateur mondial de centres de données traditionnels et hyperscale. Newmark a constaté que la demande de nouveaux centres de données aux États-Unis dépassait de loin les niveaux de capacité actuels, en particulier dans les grandes villes américaines et leurs environs.
Les avancées technologiques induites par l'IA et le machine learning nécessiteront des quantités d'électricité de plus en plus importantes. Dans le même rapport de 2024, Newmark prévoyait que la puissance nécessaire pour les centres de données en 2030 (lien externe à ibm.com) devrait presque doubler par rapport à son niveau de 17 MW en 2022. Selon Newmark, la consommation totale des centres de données atteindra 35 GW.
Découvrez la manière la plus simple de déployer IBM Storage Scale avec des performances et une capacité passant de 1 à plus de 1 000 nœuds.
Mettez à jour votre infrastructure de stockage avec les commutateurs SAN de type B et C d’IBM, et réduisez votre coût total de possession.
Faites passer votre adoption d’IBM Cloud à la vitesse supérieure avec un accélérateur prenant en charge un large éventail d’applications et de zones de destination.
Équilibrez les deux côtés de l’équation du stockage des données grâce aux logiciels (comme IBM FlashSystem) et aux solutions matérielles d’IBM.
Les centres de données hyperscale élèvent le concept de stockage à des niveaux de productivité inédits et s’avèrent être de puissants alliés pour les applications d’IA et de machine learning. Découvrez comment exploiter au mieux ces nouvelles fonctionnalités puissantes dans votre entreprise grâce à IBM Storage Scale.