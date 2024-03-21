Publicado: 21 de marzo de 2024
Colaboradores: Phill Powell, Ian Smalley
Un centro de datos a hiperescala es un centro de datos masivo que proporciona capacidades de escalabilidad extremas. Está diseñado para cargas de trabajo a gran escala con una infraestructura de red optimizada, una conectividad de red racionalizada y una latencia minimizada.
Debido a la demanda cada vez mayor de almacenamiento de datos, los centros de datos a hiperescala se utilizan ampliamente a nivel mundial para numerosos proveedores y una amplia variedad de propósitos que incluyen inteligencia artificial (IA), automatización, análisis de datos, almacenamiento de datos, procesamiento de datos y otros big data. actividades informáticas.
Conviene dedicar un instante a clarificar estos términos y sus posibles ambigüedades. Para empezar, ambos términos suelen utilizarse indistintamente, lo que puede crear confusión.
"Hiperescaladores" se utiliza a menudo para referirse a los centros de datos a hiperescala a modo de apodo. Lamentablemente, el término "hiperescaladores" ya tiene un significado establecido y se utiliza con la misma frecuencia para referirse a los proveedores de servicios en la nube (CSP) como AWS y otras empresas que ofrecen servicios de centros de datos a hiperescala.
Teniendo en cuenta que el mismo término puede utilizarse para denotar tanto un tipo de centro de datos como las empresas especializadas en informática a hiperescala y que son proveedoras de esos centros de datos, cabe la posibilidad de que se produzcan confusiones (por ejemplo, "El hiperescalador ha creado el hiperescalador"). Así que, a efectos de esta página, hablaremos de centros de datos a hiperescala, refiriéndonos a los proveedores de servicios en la nube (CSP) , cada uno con su propio término y evitando el concepto más genérico de "hiperescalador".
Los centros de datos (de todos los tamaños) se remontan en sus orígenes al importante concepto de la virtualización. La virtualización utiliza software para crear una capa de abstracción sobre el hardware del ordenador, lo que permite compartimentar los componentes de hardware de un único ordenador en múltiples Virtual Machines (VM). Cada VM ejecuta su propio sistema operativo y se comporta como un ordenador independiente, aunque se esté ejecutando sobre sólo una parte del hardware real del ordenador físico de base. De este modo, la virtualización hace posible el cloud computing.
Un centro de datos a hiperescala se diferencia principalmente de un centro de datos tradicional por su enorme tamaño. Un centro de datos a hiperescala requiere un emplazamiento físico lo suficientemente grande como para albergar todos los equipos asociados. Esto supone al menos 5000 servidores y, muy posiblemente, kilómetros de equipo de conexión. Como tales, los centros de datos a hiperescala pueden abarcar fácilmente millones de metros cuadrados de superficie.
La redundancia es otro aspecto importante de los centros de datos a hiperescala. Esto significa simplemente proporcionar medidas y/o dispositivos de reserva que puedan activarse automáticamente en caso de avería en los equipos o ante un apagón. La redundancia es un factor crucial sobre todo para los centros de datos a hiperescala, ya que estos sistemas suelen funcionar de forma automática, en segundo plano, las 24 horas del día y con poca supervisión directa.
A una organización que desee operar un centro de datos a hiperescala no le faltarán decisiones que tomar mientras decide cuál es el mejor plan de actuación a seguir. La primera de estas preguntas puede ser: "¿Construimos o alquilamos?" La construcción de un centro de datos, por modesto que sea, ya supone una inversión de cierto nivel. Construir un centro de datos a hiperescala requiere un compromiso financiero todavía más serio.
Muchas empresas optan por otra vía eligiendo un centro de datos de colocación: un centro de datos cuyos propietarios alquilan las instalaciones y el espacio de los servidores a otras empresas. La conveniencia de este método es obvia: alquilar un espacio para los equipos exige una inversión significativamente menor que construir una estructura entera para albergar todo el equipo, por lo menos en lo que se refiere al pago inicial.
Comparando estas dos opciones básicas, queda claro que cada una presenta sus ventajas e inconvenientes. Construir un centro de datos a hiperescala suele ser caro y requiere mucho esfuerzo, pero también ofrece una instalación a hiperescala que se habrán diseñado a medida para esa empresa, optimizando convenientemente todos los aspectos que se puedan ajustar.
Durante ese tiempo, alquilar espacio en un centro de datos de colocación ofrece más opciones de movilidad y requiere una inversión infinitamente menor. Aunque será poco probable que un centro de datos de colocación haya sido diseñado según las especificaciones ideales para ese cliente.
Algunas organizaciones están buscando otra opción, una que les asegure que, a medida que continúen avanzando, podrán escalar aún más sin tener que adquirir costosos equipos de almacenamiento adicionales para su sistema basado en la nube privada. Para muchas de estas empresas, la respuesta adecuada pasa por migrar de un sistema propietario privado y trasladar sus operaciones a un entorno de nube pública, como el que encuentran con aplicaciones de software como servicio (SaaS) como Microsoft 365 o Google Suite.
Existen otras variantes, como los centros de datos modulares, que son instalaciones prefabricadas que se diseñan para su uso como centros de datos. Los centros de datos modulares no sólo están prefabricados, sino que también vienen preinstalados y equipados con los equipos de refrigeración necesarios.. Los centros de datos modulares son ideales para las organizaciones que desean experimentar con la funcionalidad de un centro de datos de forma limitada, antes de efectuar grandes inversiones, así como para aquellas empresas que necesitan implantar rápidamente una solución de centro de datos fiable.
Los centros de datos se llevan utilizando desde la década de 1940, cuando un único y gigantesco ordenador llenaba los espacios de departamentos enteros. A medida que los ordenadores fueron optimizando sus dimensiones con el paso de los años, el espacio físico que se les asignaba también experimentó cambios. Después, en la década de 1990, se produjo la primera irrupción de los microordenadores, que redujeron radicalmente el tamaño necesario para las operaciones informáticas. No pasó mucho tiempo antes de que a las "salas de servidores" se pasaron a llamar "centros de datos".
En cuanto a hitos importantes, se suele considerar que el primer centro de datos a hiperescala fue puesto en marcha en 2006 por Google en The Dalles, Oregón (cerca de Portland). Esta instalación a hiperescala ocupa actualmente 1,2 millones de metros cuadrados de espacio y emplea a una plantilla de aproximadamente 200 operadores de centros de datos. Utilizamos el término "actualmente" porque Google está llevando a cabo planes para ampliar este "campus energético" con un proyecto de expansión de 600 millones de dólares que añadirá un quinto edificio de 27 000 metro cuadrados. Como muestra de su firme compromiso con esta tecnología, Google opera en la actualidad 14 instalaciones de centros de datos en EE. UU., así como 6 en Europa, 3 en Asia y 1 en Chile.
En la actualidad, las instalaciones a hiperescala más grandes del mundo (enlace externo a ibm.com) se encuentran en la región china de Mongolia Interior. Allí es donde China Telecom opera un centro de datos a hiperescala de casi un millón se metros cuadrados. Dicho de otro modo, el mayor centro de datos tiene el tamaño de 165 campos reglamentarios de fútbol americano, todos unidos en un espacio con un ancho de 11 campos y un largo de 15 campos de fútbol americano. No es de extrañar que este gigantesco centro de datos a hiperescala (cuya construcción costó 3000 millones de dólares) esté equipado con todo lo que necesita desde el punto de vista funcional, e incluso cuente con instalaciones destinadas como residencia para los operadores de centros de datos a hiperescala que trabajan en él.
Clasificar a las principales empresas de hiperescalado puede resultar difícil. En primer lugar, está la cuestión relativamente fácil de definir los criterios que se utilizarán. En teoría, cabría fijarse en el número de centros de datos a hiperescala propios o construidos. Aunque no es un modo del todo exacto de juzgar la prestación de servicios en la nube por parte de una empresa, ya que numerosas compañías (incluida Apple) alquilan algunos de los centros de datos que utilizan a otros proveedores de servicios.
Eso sólo deja un medio viable de comparación: el porcentaje de cuota de mercado. Este es, en última instancia, el mejor indicador de qué empresas de hiperescalado están impulsando realmente el mercado. Aunque este método sea levemente imperfecto, puesto que el mercado de la informática a hiperescala nunca es estático, siempre está en estado de cambio.
Sin embargo, existe una amplia evidencia de tendencias que sugieren que un selecto grupo de tres proveedores de hiperescalado ha establecido actualmente un sólido dominio sobre el mayor segmento de este mercado:
En la actualidad, AWS es el mayor proveedor de servicios en la nube a hiperescala, con una cuota de mercado de AWS (enlace externo a ibm.com) de aproximadamente el 32 %. AWS opera en 32 regiones de nube y 102 zonas de disponibilidad, con un espacio total de unos 3,2 millones de metros cuadrados. AWS goza de reconocimiento por su experiencia en automatización, gestión de bases de datos y analytics de datos.
La popular plataforma de hiperescalado Azure de Microsoft actualmente acumula aproximadamente el 23 % (enlace externo a ibm.com) del mercado de hiperescalado. Azure opera en 62 regiones de nube, con 120 zonas de disponibilidad. No es sorprendente que Microsoft Azure funcione especialmente bien en combinación con el software de Microsoft para centros de datos empresariales.
Conocida originalmente y principalmente por su amplia experiencia en gestión de datos, Google Cloud controla aproximadamente el 10 % (el enlace reside fuera de ibm.com) del mercado de hiperescala y opera en 39 regiones de nube, con 118 zonas de disponibilidad. Además del tratamiento y proceso de datos, GCP atrae a las empresas por su fortaleza en inteligencia artificial (IA) y analytics avanzado.
En este mismo mercado operan otros muchos proveedores en un nivel secundario en cuanto a porcentaje de cuota de mercado.
Alibaba Cloud: aunque no es tan grande como AWS u otros proveedores punteros, Alibaba posee una fuerte cuota de mercado de hiperescala dentro de la región de Asia y países del Pacífico. Entre sus ofertas destacan los productos relacionados con las infraestructuras y los servicios de IA.
Apple: Apple utiliza un modelo híbrido para sus servicios en la nube. Apple posee ocho centros de datos en EE. UU., Europa y China, con planes para construir más. Además, Apple tiene acuerdos de arrendamiento plurianuales para servicios de cloud computing de proveedores como AWS y GCP.
IBM Cloud: desde hace tiempo, IBM Cloud es sinónimo de expansión tecnológica. Cuenta con una gran experiencia en el trabajo con centros de datos empresariales y en la prestación de servicios en una amplia gama de áreas relacionadas. Últimamente, el trabajo pionero de la empresa con la IA le está aportando una visibilidad renovada.
Meta Platforms: Meta Platforms, la empresa matriz detrás de populares plataformas en línea como Facebook e Instagram, opera 21 centros de datos a hiperescala en todo el mundo, cuyo espacio total supera los 50 millones de pies cuadrados.
Oracle Cloud Infrastructure (OCI): OCI se ha posicionado como una alternativa de menor coste a AWS, ofreciendo servicios similares a un precio significativamente reducido. OCI destaca por permitir la creación de aplicaciones nativas de la nube y la migración sencilla de cargas de trabajo de misión crítica.
El consumo energético es el problema más acuciante que rodea a los centros de datos a hiperescala. La enorme potencia de cálculo necesaria para hacer funcionar los centros de datos a hiperescala procede de una enorme cantidad de energía eléctrica. Al igual que sucede con el auge de las criptomonedas y la minería de bitcoins, los centros de datos a hiperescala son un avance tecnológico bastante reciente cuyo apetito inusualmente grande por la energía los sitúa, al menos en cierto modo, en contradicción con los objetivos de sostenibilidad ecológica (aunque algunas empresas están encontrando formas de mitigar o incluso eliminar estos problemas).
Además de los miles de servidores informáticos en funcionamiento constante, también hay que tener en cuenta las necesidades eléctricas de los equipos de alimentación y de red (como transformadores y enrutadores), además de los sistemas de refrigeración de importancia crítica que evitan que el hardware alcance situaciones de sobrecarga térmica. Y eso ni siquiera empieza a contemplar los costes de construcción y funcionamiento de una enorme estructura para contener esta colmena de actividad.
Por este motivo, la eficiencia energética es crucial para el funcionamiento eficaz de los centros de datos a hiperescala. Que un servidor no funcione al máximo rendimiento puede considerarse de poca importancia. Pero si las instalaciones de hiperescalado contienen miles de servidores que no funcionan de forma eficiente, pasará a considerarse un problema mucho mayor y más caro.
Dependiendo de su tamaño, los centros de datos a hiperescala pueden requerir megavatios de potencia o incluso gigavatios. Hay tanta variación entre los centros de datos a hiperescala que fijar una cantidad media de consumo energético puede resultar difícil. Estas orientaciones sobre centros de datos de diferentes tamaños no son de carácter oficial, sino que han sido ratificadas extraoficialmente a lo largo del tiempo, y pueden ayudar a comprender de forma general estas instalaciones:
Microcentro de datos: el centro de datos más pequeño reconocido es utilizado generalmente por empresas individuales o para oficinas remotas. Los microcentros de datos suelen tener una capacidad de 10 racks de servidores o menos, lo que equivale a una capacidad total de aproximadamente 140 servidores. Los microcentros de datos suelen ocupar menos de 500 metros cuadrados de espacio. Consumo de energía: menos de 100-150 kW.
Centro de datos pequeño: los centros de datos pequeños suelen ocupar entre 500 y 2000 metros cuadrados de espacio y pueden albergar entre 500 y 2000 servidores. Consumo de energía: 1 - 5 MW.
Centro de datos medio: el centro de datos en las instalaciones medio suele albergar entre 2000 y 5000 servidores. Asimismo, su superficie en metros cuadrados podrían variar entre 2000 y 10 000 metros cuadrados. Consumo de energía: alrededor de 100 MW.
Centros de datos a hiperescala: La definición del IDC de un hiperescalador (enlace externo a ibm.com) sostiene que para ser considerado un verdadero centro de datos a hiperescala, la instalación debe contener al menos 5000 servidores y ocupar al menos 929 metros cuadrados de espacio físico. Consumo de energía: más de 100 MW.
La enorme necesidad de potencia que requiere todo lo relacionado con los datos a hiperescala plantea un rompecabezas geográfico a las empresas que desean realizar grandes inversiones en este tipo de infraestructuras.
La energía es más cara en función de su ubicación, y las empresas suelen buscar países o zonas sin desarrollar o subdesarrollados como posibles lugares de construcción de sus centros de datos a hiperescala, porque el precio de la electricidad es más atractivo en esas economías.
Aunque ese es sólo un criterio a tener en cuenta. Encontrar una zona con una fuente de energía asequible es clave, al igual que observar la sostenibilidad local. Pero también lo es localizar un emplazamiento que no esté sometido a situaciones meteorológicas constantes y peligrosas que podrían poner en peligro las funciones de misión crítica de una empresa por cortes de energía y tiempos de inactividad.
Las empresas intentan equilibrar sus iniciativas corporativas con los objetivos de sostenibilidad de modo que los centros de datos a hiperescala sean asequibles en cuanto a su funcionamiento y dejen la menor huella de carbono posible. El afán por reducir el consumo de energía está empujando incluso a las empresas a apostar por soluciones de energías renovables para alimentar sus centros de datos a hiperescala. La mayoría de las grandes empresas dedicadas a la informática a hiperescala han investigado o están explorando ahora opciones de energías renovables como la energía solar y la eólica como forma de compensar su considerable consumo de energía.
En algunos casos, los proveedores de servicios en la nube incluso se han comprometido a garantizar que sus centros de datos ofrezcan una sostenibilidad total. Muy impresionante es Apple (enlace externo a ibm.com), que lleva apoyando la sostenibilidad con acciones constructivas reales desde 2014. Fue entonces cuando la empresa dispuso que todos sus centros de datos pasaran a funcionar completamente a base de energías renovables. Desde hace una década, los centros de datos de Apple, todos ellos, funcionan con diversas combinaciones de pilas de combustible de biogás, energía hidroeléctrica, energía solar y energía eólica.
El boom de los datos no muestra signos de detenerse, ni siquiera de amainar. De hecho, muchos indicios apuntan a que aún está en pleno auge.
Nunca ha habido un momento en el que se produjeran, registraran y estudiaran tantos datos. La tecnología ha alcanzado un hito en el que incluso los artilugios más sencillos están tan ingeniosamente diseñados que muchos de ellos generan datos de forma independiente y los transmiten con fines de archivo y análisis, a través de la Internet de las Cosas (IoT).
El think tank Synergy Research Group (que proporciona investigación cuantitativa e inteligencia de mercado) anunció en octubre de 2023 sus conclusiones, que muestran que los avances en IA ayudarán a impulsar al alza la capacidad de los centros de datos a hiperescala y que, de aquí a 2028, la media de capacidad de los centros de datos a hiperescala (enlace externo a ibm.com) se triplicará con creces.
La creación de centros de datos a hiperescala estimula otros sectores, como el manufacturero (piense en los miles de bastidores para servidores que hay que fraguar). Otro sector es el inmobiliario, en el que se compran y venden enormes parcelas de terreno sin urbanizar para que las utilicen estas megainstalaciones. El sector de la construcción también se beneficia de ello.
El informe Newmark 2024 (enlace externo a ibm.com) analizó una situación actual que afecta al mercado estadounidense, el mayor consumidor mundial de centros de datos y centros de datos a hiperescala. Newmark descubrió que la demanda de nuevos centros de datos en Estados Unidos supera con creces los niveles de capacidad actuales, especialmente en las principales ciudades estadounidenses y sus alrededores.
Los saltos tecnológicos introducidos por la IA y el machine learning requerirán cantidades cada vez mayores de electricidad. En el mismo informe de 2024, Newmark proyectó que la potencia necesaria para los centros de datos en 2030 (enlace externo a ibm.com) casi se duplicará, en comparación con su nivel de 2022 de 17 MW. Newmark prevé que el uso total de los centros de datos alcance los 35 GW.
