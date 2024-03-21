Publicado: 21 de marzo de 2024
Colaboradores: Phill Powell, Ian Smalley
Un centro de datos de hiperescala es un centro de datos masivo que proporciona capacidades de escalabilidad extrema y está diseñado para cargas de trabajo a gran escala, con una infraestructura de red optimizada, conectividad de red más eficiente y latencia minimizada.
Debido a la demanda creciente de almacenamiento de datos, los centros de datos de hiperescala se utilizan de forma generalizada a nivel mundial para numerosos proveedores y una amplia variedad de propósitos que incluyen inteligencia artificial (IA), automatización, análisis de datos, almacenamiento de datos, procesamiento de datos y otras actividades de computación de big data.
Vale la pena tomarse un momento para aclarar estos términos y cualquier ambigüedad que puedan presentar. En primer lugar, los términos a menudo se usan de manera indistinta, lo que puede crear confusión.
El término "hiperescaladores" se utiliza con frecuencia como nombre informal para referirse a los centros de datos de hiperescala. Lamentablemente, el término “hiperescaladores” ya tiene un significado establecido y se utiliza con la misma frecuencia para referirse a proveedores de servicios en la nube (CSP) como AWS y otras empresas que ofrecen servicios de centros de datos de hiperescala.
Dado que el mismo término puede utilizarse para denominar tanto a un tipo de centro de datos como a las empresas que se especializan en computación a hiperescala y proporcionan esos centros de datos, existe la posibilidad de confusión (por ejemplo, “El hiperescalador creó el hiperescalador”). Por lo tanto, para los fines de esta página, analizaremos los centros de datos de hiperescala y nos referiremos a los proveedores de servicios en la nube (CSP), cada uno por su término único, y evitaremos el término más genérico "hiperescalador".
Los centros de datos (de todos los tamaños) pueden rastrear sus orígenes hasta el importante concepto de virtualización. La virtualización utiliza software para crear una capa de abstracción sobre hardware informático que permite la división de los componentes de hardware de una sola computadora en múltiples máquinas virtuales (VM). Cada máquina virtual ejecuta su propio sistema operativo y se comporta como una computadora independiente, aunque se ejecuta solo en una parte del hardware real de la computadora subyacente. De esta manera, la virtualización permite la computación en la nube.
Un centro de datos de hiperescala difiere principalmente de los centros de datos tradicionales debido a su gran tamaño. Un centro de datos de hiperescala requiere un sitio físico lo suficientemente grande como para albergar todos los equipos asociados, incluyendo al menos 5000 servidores y, muy posiblemente, kilómetros de equipos de conexión. Como tal, los centros de datos de hiperescala pueden abarcar fácilmente millones de pies cuadrados de espacio.
La redundancia es otro aspecto importante de los centros de datos de hiperescala. Simplemente significa proporcionar medidas de respaldo o dispositivos que puedan activarse de forma automática en caso de que el equipo falle o se corte la energía. La redundancia es especialmente crítica para los centros de datos de hiperescala porque estos sistemas a menudo se ejecutan automáticamente, en segundo plano, las 24 horas del día y con poca supervisión directa.
Una organización que desee operar un centro de datos de hiperescala tendrá que tomar muchas decisiones para determinar el mejor curso de acción a seguir. La primera de estas preguntas puede ser: "¿Deberíamos construir o alquilar?" Construir incluso un centro de datos modesto implicará cierto nivel de inversión. La construcción de un centro de datos de hiperescala requiere un compromiso financiero que es aún más serio.
Muchas empresas optan por seguir otro camino y eligen un centro de datos de coubicación, es decir, un centro de datos cuyos propietarios alquilan instalaciones y espacio en servidores a otras empresas. El atractivo de este método debería ser evidente de inmediato. Alquilar espacio para hardware exige una inversión significativamente menor que construir una estructura completa para albergar equipos, al menos en términos de dinero pagado por adelantado.
Al comparar las dos opciones básicas, está claro que cada una tiene sus ventajas y desventajas. La construcción de un centro de datos de hiperescala suele ser costosa y requiere mucha mano de obra, pero también ofrece instalaciones de hiperescala que se construyen a medida para esa empresa, con todos sus aspectos ajustables convenientemente optimizados.
Mientras tanto, alquilar espacio en un centro de datos de coubicación ofrece más opciones de movilidad y requiere una inversión infinitamente menor. Pero es muy poco probable que un centro de datos coubicado haya sido diseñado según las especificaciones ideales de ese cliente.
Algunas organizaciones están buscando otra opción, una que les garantice que, a medida que avancen, podrán escalar sin tener que comprar equipos de almacenamiento adicionales y costosos para su sistema basado en la nube privada. Para muchas de estas empresas, la respuesta correcta implica migrar de un sistema privado y trasladar sus operaciones a un entorno de nube pública, como sucede con las aplicaciones de software como servicio (SaaS) como Microsoft 365 o Google Suite.
Existen otras variaciones, como los centros de datos modulares, que son instalaciones prediseñadas para usar como centros de datos. Los centros de datos modulares no solo están prediseñados, sino que también cuentan con el equipamiento y las tuberías de refrigeración necesarios. Los centros de datos modulares son ideales para organizaciones que desean experimentar con la funcionalidad del centro de datos de forma limitada antes de realizar grandes inversiones, así como para aquellas empresas que necesitan implementar una solución de centro de datos confiable con rapidez.
Los centros de datos se han utilizado desde la década de 1940, cuando una sola computadora gigantesca llenaba espacios de departamentos completos. A medida que las computadoras se volvieron más eficientes en tamaño a lo largo de los años, el espacio físico local asignado también evolucionó. Luego, en la década de 1990, se vio la primera irrupción de las microcomputadoras, lo que redujo radicalmente la cantidad de espacio necesario para las operaciones de TI. No pasó mucho tiempo antes de que las "salas de servidores" se llamaran "centros de datos".
En términos de avances importantes, a menudo se considera que el primer centro de datos de hiperescala fue lanzado en 2006 por Google en The Dalles, Oregon (cerca de Portland). Actualmente, esta instalación a hiperescala ocupa una superficie de 1.3 millones de pies cuadrados y emplea a una plantilla de aproximadamente 200 operadores de centros de datos. El término “actualmente” se utiliza porque Google planea escalar este “campus de energía” con un proyecto de expansión de 600 millones USD que agregará un quinto edificio de 290 000 pies cuadrados. Demostrando su mayor compromiso con esta tecnología, Google ahora opera 14 centros de datos en los Estados Unidos, 6 en Europa, 3 en Asia y 1 en Chile.
En la actualidad, las instalaciones de hiperescala más grandes del mundo (enlace externo a ibm.com) existen dentro de la región de Mongolia Interior en China. Ahí es donde China Telecom opera un centro de datos de hiperescala de aproximadamente 10.7 millones de pies cuadrados. Dicho de otra manera, el centro de datos más grande tiene el tamaño de 165 campos de fútbol reglamentarios de Estados Unidos, todos unidos en un espacio de 11 campos de fútbol de ancho y 15 de largo. No es de extrañar que este enorme centro de datos de hiperescala (cuya construcción costó USD 3000 millones) esté equipado con todo lo que necesita funcionalmente e incluso cuente con instalaciones residenciales para los operadores de centros de datos de hiperescala que trabajan allí.
La clasificación de las principales empresas de hiperescala puede resultar problemática. En primer lugar, está la cuestión relativamente fácil de definir qué criterios se utilizarán. En teoría, podríamos enfocarnos en el número de centros de datos de hiperescala propios o construidos, pero no es una forma del todo precisa de juzgar la prestación de servicios en la nube por parte de una empresa, ya que muchas de ellas (incluyendo Apple) alquilan algunos de los centros de datos que utilizan a otros proveedores de servicios.
Eso deja solo un medio viable de comparación: el porcentaje de participación en el mercado. En última instancia, este es el mejor indicador de qué empresas de hiperescala están realmente impulsando el mercado. Aunque este método es ligeramente imperfecto, porque el mercado de la computación a hiperescala nunca es estático, siempre está en estado de cambio.
Sin embargo, existe una amplia evidencia de la tendencia que sugiere que un nivel superior de tres proveedores de hiperescala ha establecido actualmente un control sólido en el segmento más grande de este mercado:
Actualmente, AWS es el mayor proveedor de servicios en la nube a hiperescala y ocupa una posición dominante, con una participación en el mercado de AWS (enlace externo a ibm.com) de aproximadamente el 32 %. AWS opera en 32 regiones de nube y 102 zonas de disponibilidad, con un espacio total de 33.5 millones de pies cuadrados. AWS es conocida por su experiencia en automatización, gestión de bases de datos y análisis de datos.
Azure, la popular plataforma de hiperescala de Microsoft, actualmente tiene alrededor del 23 % (enlace externo a ibm.com) del mercado de hiperescala. Azure opera en 62 regiones de nube, con 120 zonas de disponibilidad. No es sorprendente que Microsoft Azure funcione especialmente bien en conjunto con el software de Microsoft para centros de datos empresariales.
Al principio conocida principalmente por su vasta experiencia en el manejo de datos, Google Cloud controla aproximadamente el 10 % (enlace externo a ibm.com) del mercado de hiperescala y opera en 39 regiones de nube, con 118 zonas de disponibilidad. Además del manejo y procesamiento de datos, GCP atrae a las empresas por sus fortalezas en inteligencia artificial (IA) y análisis avanzados.
Muchos otros proveedores operan en este mismo mercado dentro de un nivel secundario de porcentaje de participación de mercado.
Alibaba Cloud: Aunque no es tan grande como AWS u otros proveedores principales, Alibaba posee una fuerte participación en el mercado de hiperescala dentro de la región Asia-Pacífico. Sus ofertas más destacadas incluyen productos relacionados con la infraestructura y servicios de IA.
Apple: Apple utiliza un modelo híbrido para sus servicios en la nube. Apple posee ocho centros de datos en Estados Unidos, Europa y China y tiene previsto construir más. Además, Apple tiene acuerdos plurianuales de arrendamiento de servicios de computación en la nube de proveedores como AWS y GCP.
IBM Cloud: Por mucho tiempo ha sido sinónimo de expansión tecnológica. IBM Cloud tiene una amplia experiencia trabajando con centros de datos empresariales y brindando servicios en una amplia gama de áreas relacionadas. Recientemente, el trabajo pionero de la empresa con la IA le está dando una visibilidad renovada.
Meta Platforms: La empresa matriz detrás de plataformas en línea populares como Facebook e Instagram, Meta Platforms opera 21 centros de datos de hiperescala en todo el mundo cuyo espacio total supera los 50 millones de pies cuadrados.
Oracle Cloud Infrastructure (OCI): OCI se ha posicionado como una alternativa de menor costo a AWS, ofreciendo servicios similares a un precio significativamente menor. OCI se destaca por permitir la creación de aplicaciones nativas de la nube y la fácil migración de cargas de trabajo de misión crítica.
El consumo energético es el problema más urgente de los centros de datos de hiperescala. La enorme potencia informática necesaria para el funcionamiento de los centros de datos de hiperescala procede de una cantidad descomunal de energía eléctrica. Al igual que el auge de las criptomonedas y la minería de bitcoins, los centros de datos de hiperescala son un desarrollo tecnológico bastante reciente cuya demanda de energía inusualmente grande los sitúa, al menos en cierto modo, en conflicto con los objetivos de sustentabilidad ecológica (aunque algunas empresas están encontrando formas de mitigar o incluso eliminar tales problemas).
Además de los miles de servidores informáticos que están en constante funcionamiento, también hay que considerar las necesidades de electricidad de los equipos de red y de energía (como transformadores y enrutadores), además de los sistemas de refrigeración de importancia crítica que evitan que el hardware alcance situaciones de sobrecarga térmica. Y eso ni siquiera comienza a abordar los costos de construcción y funcionamiento de una enorme estructura para contener esta colmena de actividad.
Es por eso que la eficiencia energética es tan crucial para ejecutar centros de datos de hiperescala de manera efectiva. Si un servidor no funciona con la máxima eficiencia, esto podría considerarse de importancia insignificante. Pero si las instalaciones de hiperescala contienen miles de servidores que no funcionan de manera eficiente, eso se va a considerar un problema mucho mayor y más costoso.
Dependiendo de su tamaño, los centros de datos de hiperescala pueden requerir megavatios de potencia o incluso gigavatios. Hay tanta variación entre los centros de datos de hiperescala que determinar una cantidad promedio de uso de energía puede ser difícil. Estas pautas de centros de datos de diferentes tamaños no son definiciones oficiales, pero se han ratificado extraoficialmente a lo largo del tiempo y pueden ayudar a nuestra comprensión general de estas instalaciones:
Microcentro de datos: El centro de datos más pequeño reconocido generalmente es utilizado por empresas individuales o para oficinas remotas. Los microcentros de datos suelen tener una capacidad de 10 racks de servidores o menos, lo que da como resultado una capacidad total de aproximadamente 140 servidores. Los microcentros de datos suelen ocupar menos de 5000 pies cuadrados de espacio. Consumo de energía: Menos de 100-150 kW.
Centro de datos pequeño: Los centros de datos pequeños normalmente requieren entre 5000 y 20
000 pies cuadrados de espacio y pueden albergar entre 500 y 2000 servidores. Consumo de energía: 1–5 MW.
Centro de datos promedio: El centro de datos promedio en un entorno local generalmente tiene entre 2000 y 5000 servidores. Asimismo, su superficie podría variar entre 20 000 y 100 000 pies cuadrados. Consumo de energía: Alrededor de 100 MW.
Centros de datos de hiperescala: La definición de IDC de un hiperescalador (el enlace se encuentra fuera de ibm.com) sostiene que para ser considerado un verdadero centro de datos de hiperescala, la instalación debe contener al menos 5 000 servidores y ocupar al menos 10 000 pies cuadrados de espacio físico. Consumo de energía: Más de 100 MW.
Las enormes necesidades de energía requeridas por los problemas de datos a hiperescala plantean un rompecabezas geográfico para las empresas que desean hacer grandes inversiones en este tipo de infraestructura.
La energía es más cara dependiendo de su ubicación y, a menudo, las empresas miran a países o áreas regionales subdesarrollados como posibles sitios de construcción para sus centros de datos de hiperescala porque el precio de la electricidad es más atractivo en esas economías.
Pero ese es solo un criterio a considerar. Encontrar un área con una fuente de energía asequible es clave, al igual que observar la sustentabilidad local. Pero también lo es ubicar un sitio que probablemente no esté sujeto a situaciones climáticas constantes y peligrosas que podrían poner en riesgo las funciones de misión crítica de una empresa a través de cortes de energía y tiempo de inactividad.
Las empresas están tratando de equilibrar sus iniciativas corporativas con objetivos de sustentabilidad para que los centros de datos de hiperescala sean asequibles de ejecutar y dejen una huella de carbono lo más ligera posible. El impulso para reducir el uso de energía está empujando a las empresas a impulsar soluciones de energía renovable para alimentar sus centros de datos de hiperescala. La mayoría de las principales empresas involucradas en la computación a hiperescala han investigado, o ahora están explorando, opciones de energía renovable como la energía solar y la energía eólica, como una forma de compensar su considerable consumo de energía.
En algunos casos, los proveedores de servicios en la nube se han comprometido a garantizar que sus centros de datos ofrezcan una sustentabilidad completa. La más impresionante es Apple (enlace externo a ibm.com), que ha apoyado la sustentabilidad con una acción constructiva real desde 2014. Fue entonces cuando la empresa ordenó que todos sus centros de datos se alimentaran por completo con energía renovable. Desde hace una década, todos los centros de datos de Apple funcionan con varias combinaciones de pilas de combustible de biogás, energía hidroeléctrica, energía solar y energía eólica.
El auge de los datos no muestra señales de detenerse ni de disminuir. De hecho, existe mucha evidencia que sugiere que todavía está aumentando.
Nunca ha habido un momento en el que se hayan producido, registrado y estudiado tantos datos. La tecnología ha alcanzado un hito en el que incluso los dispositivos más sencillos están diseñados de forma tan inteligente que muchos de ellos generan datos de forma independiente y los transmiten con fines de archivo y análisis, a través del Internet de las cosas (IoT).
El centro de estudios Synergy Research Group (que proporciona investigación cuantitativa e inteligencia de mercado) anunció sus conclusiones en octubre de 2023 que muestran que los avances de la IA ayudarán a impulsar la capacidad de los centros de datos de hiperescala y que, de aquí a 2028, la capacidad promedio de los centros de datos de hiperescala (enlace externo a ibm.com) se triplicará con creces.
La creación de centros de datos de hiperescala estimula otras industrias, como la fabricación (considere los miles de racks de servidores que deben forjarse). Otra industria es la inmobiliaria, donde se compran y venden enormes parcelas de tierra sin urbanizar para que las utilicen estas megainstalaciones. La industria de la construcción también se beneficia.
Un informe de Newmark de 2024 (enlace externo a ibm.com) analizó una situación actual que afecta al mercado estadounidense, el mayor consumidor de centros de datos y centros de datos de hiperescala del mundo. Newmark descubrió que la demanda de nuevos centros de datos en Estados Unidos supera con creces los niveles de capacidad actuales, especialmente en las principales ciudades estadounidenses y sus alrededores.
Los avances tecnológicos introducidos por la IA y el aprendizaje automático requerirán cantidades cada vez mayores de electricidad. En el mismo informe de 2024, Newmark proyectó que necesitaba potencia del centro de datos en 2030 (enlace externo a ibm.com) casi duplicado, en comparación con su nivel 2022 de 17 MW. Newmark espera que el uso total del centro de datos alcance los 35 GW.
