La computación de alto rendimiento (HPC) es una tecnología que emplea clústeres de potentes procesadores que funcionan en paralelo para procesar conjuntos masivos de datos multidimensionales, también conocidos como big data, y resolver problemas complejos a velocidades altísimas. La HPC resuelve algunos de los problemas informáticos más complejos de la actualidad en tiempo real.
Los sistemas HPC suelen funcionar a velocidades más de un millón de veces más rápidas que los sistemas más rápidos de escritorio, portátiles o servidores.
Durante décadas, las supercomputadoras (computadoras especialmente diseñadas que incorporan millones de procesadores o núcleos de procesador) fueron clave en la computación de alto rendimiento. Las supercomputadoras todavía están con nosotros. Al momento de la redacción de este artículo, la supercomputadora más rápida es la estadounidense Frontier (enlace externo a ibm.com), con una velocidad de procesamiento de 1.102 exaflops, o quintillones de operaciones de coma flotante por segundo (flops). Pero hoy en día, cada vez más organizaciones ejecutan servicios de HPC en clústeres de servidores informáticos de alta velocidad, alojados on premises o en la nube.
Las cargas de trabajo de HPC descubren nuevos insights importantes que avanzan en el conocimiento humano y crean beneficios competitivos significativos. Por ejemplo, la HPC secuencia el ADN, automatiza el comercio de acciones y ejecuta algoritmos y simulaciones de inteligencia artificial (IA), como los que habilitan los vehículos autónomos, que analizan terabytes de datos que se transmiten desde sensores de IoT, radares y sistemas GPS en tiempo real para tomar decisiones en fracciones de segundo.
Lea cómo el escritorio como servicio (DaaS) permite a las empresas lograr el mismo nivel de rendimiento y seguridad que el despliegue de las aplicaciones on premises.
Las computadoras estándar realizan tareas transacción por transacción, lo que significa que la siguiente transacción, o trabajo, ocurre solo cuando la computadora completa la anterior. Por el contrario, la HPC utiliza todos los recursos o procesadores disponibles para completar muchos trabajos a la vez. Por lo tanto, el tiempo que lleva completar un trabajo depende de los recursos disponibles y del diseño utilizado. Y si hay más trabajos que procesadores, el sistema HPC forma una lista de espera.
En su mayor parte, la HPC ocurre en supercomputadoras. Estos poderosos sistemas ayudan a las organizaciones a resolver problemas que de otro modo serían insalvables. Y estos problemas, o tareas, requieren procesadores que puedan ejecutar instrucciones más rápido que las computadoras estándar, a veces ejecutando muchos procesadores en paralelo para obtener respuestas dentro de una duración práctica.
Además del procesamiento en paralelo, los trabajos de la HPC también requieren discos rápidos y memoria de alta velocidad. Por lo tanto, los sistemas HPC incluyen servidores de computación y de uso intensivo de datos con CPU potentes que se pueden escalar verticalmente y están disponibles para un grupo de usuarios. Los sistemas HPC también pueden tener muchas potentes unidades de procesamiento de gráficos (GPU) para tareas con uso intensivo de gráficos. Cabe destacar, sin embargo, que cada servidor solo aloja una única aplicación.
Los sistemas HPC también pueden escalar horizontalmente mediante clústeres. Estos clústeres constan de computadoras en red, incluidas las capacidades de programación, computación y almacenamiento. Los clústeres de HPC únicos tienen un tamaño de hasta 100 mil o más núcleos de cómputo, por ejemplo. A diferencia de los sistemas de un solo servidor, los clústeres pueden acomodar múltiples aplicaciones y recursos para un grupo de usuarios. Y aunque se gestiona mediante una programación basada en políticas, la potencia de cómputo y los recursos básicos combinados de un clúster pueden gestionar una carga de trabajo dinámica.
Hace tan solo una década, el alto costo de la HPC, que implicaba poseer o arrendar una supercomputadora o construir y alojar un clúster HPC en un centro de datos local, puso a la HPC fuera del alcance de la mayoría de las organizaciones.
Hoy en día, la HPC en la nube, a veces llamada HPC como servicio o HPCaaS, ofrece una forma significativamente más rápida, escalable y asequible para que las empresas se beneficien de la HPC. La HPCaaS suele incluir acceso a clústeres e infraestructura HPC alojados en el centro de datos de un proveedor de servicios en la nube, además de capacidades de red (como IA y analytics de datos) y experiencia en HPC.
Hoy en día, tres tendencias convergentes impulsan la HPC en la nube:
Demanda creciente
Las organizaciones de todos los sectores dependen cada vez más de los insights en tiempo real y del beneficio competitivo derivado de resolver los complejos problemas que solo las aplicaciones de HPC pueden resolver. Por ejemplo, la detección de fraude con tarjetas de crédito, algo en lo que todos confiamos y que la mayoría de nosotros experimentamos en un momento u otro, depende cada vez más de la HPC para identificar el fraude más rápido y reducir los molestos falsos positivos, incluso cuando la actividad fraudulenta se expande y las tácticas de los estafadores cambian constantemente.
Prevalencia de redes RDMA de menor latencia y mayor rendimiento
El acceso remoto directo a la memoria (RDMA) permite que una computadora en red acceda a la memoria de otra computadora en red sin involucrar el sistema operativo de la computadora ni interrumpir el procesamiento de ninguna computadora. Esto ayuda a minimizar la latencia y maximizar el rendimiento. Los nuevos tejidos RDMA de alto rendimiento, que incluyen InfiniBand, arquitectura de interfaz virtual y RDMA a través de Ethernet convergente, básicamente, hacen posible la HPC en la nube.
Disponibilidad generalizada de HPCaaS en la nube pública y en la nube privada
Hoy en día, todos los proveedores líderes de servicios en la nube pública ofrecen servicios de HPC. Y aunque algunas organizaciones continúan ejecutando cargas de trabajo de HPC altamente reguladas o sensibles on premises, muchas están adoptando o migrando a servicios de HPC de nube privada ofrecidos por proveedores de hardware y soluciones.
Las aplicaciones de HPC se convirtieron en sinónimo de aplicaciones de IA en general, y de aprendizaje automático y aprendizaje profundo en particular. Hoy en día, la mayoría de los sistemas HPC se crean teniendo en cuenta estas cargas de trabajo. Estas aplicaciones de HPC están impulsando la innovación continua en:
Salud, genómica y ciencias de la vida
El primer intento de secuenciar un genoma humano tardó 13 años. Hoy en día, los sistemas HPC pueden hacer el trabajo en menos de un día. Otras aplicaciones de HPC en la atención médica y las ciencias biológicas incluyen el descubrimiento y diseño de fármacos, el diagnóstico rápido del cáncer y el modelado molecular.
Servicios financieros
Además del comercio automatizado y la detección de fraude, la HPC impulsa aplicaciones de simulación Monte Carlo y otros métodos de análisis de riesgos.
Gobierno y defensa
Dos casos de uso de HPC en crecimiento en esta área son la predicción meteorológica y el modelado climático, los cuales implican el procesamiento de grandes cantidades de datos meteorológicos históricos y millones de cambios diarios en puntos de datos relacionados con el clima. Otras aplicaciones gubernamentales y de defensa incluyen la investigación energética y el trabajo de inteligencia.
Energía
En algunos casos que se superponen con el gobierno y la defensa, las aplicaciones HPC relacionadas con la energía incluyen procesamiento de datos sísmicos, simulación y modelado de yacimientos, análisis geoespacial, simulación de viento y mapeo del terreno.
